big data ගැන දැනගන්න කලින් අපි බලමු data එහෙම නැත්තම් දත්ත කියන්නේ මොනවටද කියල .
දත්තයක් කියන්නේ computer එක මගින් operate කරන characters , quantities එහෙම නැත්තම් symbols වලට .මේවා computer එක තුල store කරගන්නත් පුළුවන් , electrical signals වලට transfer කරන්නත් පුළුවන් .
Big data වලට උදාහරණයක් බලමුකෝ .
හොදම උදාහරණය Facebook .. සංඛ්යලේකන වලට අනුව terabytes 500 ට වඩා වැඩි new data ලබාගන්නවා Facebook database එකට හැම දවසකටම . මෙපමණ data ප්රමාණයක් generate වෙන්න හේතුව තමයි photos සහ videos upload කිරීම ,messages හුවමාරුව ,comments කිරීම යනාදී සාධක .
තවත් උදාහරණයක් තමයි New York Stock Exchange . එමගින් එක දවසකට new trade data ,1 terabyte පමණ ලැබෙනවා .
අනික තමයි එක jet engine එකකට flight time එක තුලදී මිනිත්තු 30 ක් ඇතුලත terabyte 10කට වැඩියෙන් generate කරන්න පුළුවන් .ඉතින් දවසකට flights දහස් ගානක් fly කරනකොට data generation එක petabytes දක්වා reach වෙනවා .
ඉතින් දැන්ම න් හිතනවා මේ උදාහරණ හරහා big data ගැන පොඩි හරි අවබෝධයක් ඔයාලට ලැබෙන්න ඇති කියල .
දැන් බලමු big data වල categories මොනවද කියල
big data categories 3 කට බෙදන්න පුළුවන් .
- Structured
- Unstructured
- Semi-Structured
Structured Data
stored කරන්න පුළුවන් , access කරන්න පුළුවන් , fix format එකකට process කරන්න පුළුවන් ඕනෑම දත්තයක් structured data එකක් වේ . මේවයේ data extend එක ඉතා ඉහලයි . size එක zettabyte වගේ ඉතා ඉහල range එකක් දක්වා තියනවා .
1021 bytes = 1 zettabyte ( one billion terabytes forms a zettabyte.)
An 'Employee' table in a database is an example of Structured Data
Employee_ID Employee_Name Gender Department Salary_In_lacs
2365 Rajesh Kulkarni Male Finance 650000
3398 Pratibha Joshi Female Admin 650000
7465 Shushil Roy Male Admin 500000
7500 Shubhojit Das Male Finance 500000
7699 Priya Sane Female Finance 550000
Unstructured Data
ඕනෑම හදුනන්නැති ස්වරුපයෙන් ඇති දත්ත unstructured data ලෙස හදුන්වනවා . ඊට අමතරව මෙහි ඇති තව විශේෂත්වයක් වන්නේ size එක නිරතුරුවම විශාල වෙනවා . මෙහි heterogeneous data source එකක් අන්තර්ගත වන අතර එය simple text files , images , videos වල එකතුවකින් සැදී ඇත .
උදාහරණයක් තමයි අපි google එකකින් යමක් search කලාම ලැබෙන output එක unstructured data ස්වරුපෙන් තියෙන්නේ .
Semi Structured Data
structured සහ unstructured එන ස්වරූප දෙකෙන්ම ඇති data semi structured data ලෙස හදුන්වනවා .XML file එකක ඇති data semi structured ස්වරුපෙන් ඇති data වලට උදහරනයකි .
0 comments:
Post a Comment