Monday, 26 November 2018

අද ඉගෙනගමු big data ගැන


big  data  ගැන දැනගන්න කලින් අපි බලමු data  එහෙම නැත්තම්  දත්ත කියන්නේ මොනවටද කියල .

දත්තයක් කියන්නේ computer  එක මගින් operate  කරන characters  , quantities  එහෙම නැත්තම් symbols  වලට .මේවා  computer  එක තුල store  කරගන්නත් පුළුවන් ,  electrical  signals  වලට transfer  කරන්නත් පුළුවන් . 


Big data  වලට උදාහරණයක්  බලමුකෝ .

හොදම උදාහරණය Facebook .. සංඛ්‍යලේකන වලට අනුව  terabytes  500 ට වඩා වැඩි new  data ලබාගන්නවා Facebook database  එකට හැම දවසකටම . මෙපමණ data  ප්‍රමාණයක් generate වෙන්න හේතුව තමයි photos සහ videos upload කිරීම ,messages  හුවමාරුව ,comments කිරීම යනාදී සාධක .   
               
තවත් උදාහරණයක් තමයි New  York  Stock Exchange . එමගින් එක දවසකට new trade data ,1 terabyte පමණ ලැබෙනවා .

අනික  තමයි එක jet engine  එකකට flight  time  එක තුලදී මිනිත්තු  30 ක් ඇතුලත terabyte 10කට වැඩියෙන් generate කරන්න පුළුවන් .ඉතින් දවසකට flights දහස් ගානක් fly  කරනකොට data generation එක petabytes දක්වා reach  වෙනවා .    


ඉතින් දැන්ම න් හිතනවා මේ උදාහරණ හරහා big  data  ගැන පොඩි හරි අවබෝධයක් ඔයාලට  ලැබෙන්න ඇති කියල .

දැන් බලමු big  data  වල  categories  මොනවද කියල 

big  data  categories 3 කට බෙදන්න පුළුවන් .


  1.  Structured
  2. Unstructured
  3. Semi-Structured

Structured  Data

 stored  කරන්න පුළුවන් , access  කරන්න පුළුවන් , fix format එකකට process    කරන්න පුළුවන්  ඕනෑම දත්තයක් structured  data එකක් වේ . මේවයේ data  extend  එක ඉතා ඉහලයි . size  එක zettabyte  වගේ ඉතා ඉහල range  එකක් දක්වා තියනවා .

1021 bytes =  1 zettabyte ( one billion terabytes forms a zettabyte.)


An 'Employee' table in a database is an example of Structured Data

Employee_ID    Employee_Name           Gender    Department             Salary_In_lacs
2365        Rajesh Kulkarni           Male   Finance                      650000
3398       Pratibha Joshi                  Female    Admin                      650000
7465      Shushil Roy                 Male Admin                     500000
7500     Shubhojit Das                Male Finance                      500000
7699    Priya Sane                        Female Finance                   550000


Unstructured  Data 

ඕනෑම හදුනන්නැති    ස්වරුපයෙන් ඇති  දත්ත unstructured  data  ලෙස හදුන්වනවා . ඊට අමතරව මෙහි ඇති තව විශේෂත්වයක් වන්නේ size  එක නිරතුරුවම විශාල වෙනවා . මෙහි  heterogeneous data  source එකක් අන්තර්ගත වන අතර එය simple  text  files  , images  , videos  වල එකතුවකින් සැදී ඇත . 

උදාහරණයක් තමයි අපි google  එකකින් යමක් search  කලාම ලැබෙන output  එක unstructured  data  ස්වරුපෙන් තියෙන්නේ .



Semi  Structured  Data


structured සහ unstructured  එන ස්වරූප දෙකෙන්ම ඇති data  semi  structured  data  ලෙස හදුන්වනවා  .XML  file  එකක ඇති data  semi structured  ස්වරුපෙන් ඇති data  වලට උදහරනයකි .






0 comments:

Post a Comment