විවිධාකාරයේ තොරතුරු හා දත්ත වලින් පිරිල ගිය තැනක් තමයි අන්තර්ජාලය. මේ දත්ත හා තොරතුරු එක තැනකට ළං කරන්න Google අරගත්තු තවත් උත්සාහයක් තමයි සැප්තැම්බර් 05 වෙනි දා එයාල launch කරපු Dataset Search Engine එක. Academic studies සහ reports සඳහා වෙන් වුනු ‘Google Scholar’ search engine එකට යම් ආකාරයකින් නෑකම් කියන මේ search engine එකේ අරමුණ තමයි, අන්තර්ජාලයේ විසිරිල තියෙන datasets, එහෙම නැත්නම් ’දත්ත කට්ටල ’ පමණක් තනි search bar එකකින් සොයා ගන්න පුලුවන් පහසුකම සලසන එක.

Dataset Search Engine එකක වැදගත් කම

ඇත්තටම හිතල බැලුවම විශ්ව විද්‍යාල, රාජ්‍ය/අන්තර්ජාතික ආයතන, වගේම රජයයන් විසින් අන්තර්ජාලයේ තමන්ගෙ datasets host කරන්නෙ තමන්ගෙම පෞද්ගලික වෙබ් අඩවි නැත්නම් digital libraries වල. නමුත් ගොඩක් වෙලාවට මේ දත්ත එකිනෙක link වෙලාවත්, search engines වලින් index වෙලාවත් නැති නිසා, අවශ්‍ය කෙනෙක්ට අවශ්‍ය වෙලාවට මේ කියන තොරතුරු සොයා ගැනීම අපහසු වෙනව විතරක් නෙවෙයි, සමහර වෙලාවට සොයා ගන්න කොහෙත්ම බැරි වෙනව.

Google විසින්  dataset providers ලට guidelines ලබා දීල තියෙනව, තමන්ගෙ contents, මේ dataset search engine එක මගින් index වෙන ආකාරයට සකසන්නෙ කොහොමද කියල. ඒ තමන්ගෙ දත්ත publish කරන තියෙන web pages වලට අඩංගු කරන්න ඕන, ඒ දත්ත ගැන විස්තර––––කව්ද data create කළේ, කවදද data publish කළේ, කොහොමද ඒව එක් රැස් කළේ, මොන පදනමක් යටතේ ද ඒ දත්ත පාවිච්චි කරන්න ඕන වගේ විස්තර–––පැහැදිලි කරන metatags  හරහා.

මේ පියවර වෙබ් අඩවි විසින් අනුගමනය කළාම, dataset search engine එකට පුලුවන් කම ලැබෙනව මේ දත්ත search කරන අයව (ශිෂ්‍යයන්, පුවත් වාර්තාකරුවන්, විද්‍යාඥයන්) ඒව ගබඩා කරල තියෙන අදාළ තැන් වලට යොමු කරන්න.

An example Search in Google's Dataset Search

දැනට සහ ඉදිරියට..

දැනට dataset search engine එක තියෙන්නෙ beta මට්ටමේ. ඒ වගේම තවම අපිට සොයා ගන්න පුලුවන්, පාරිසරික සහ සමාජ විද්‍යා කාණ්ඩයට අයත් දත්ත, රාජ්‍ය දත්ත සහ පුවත් ආයතන වලින් සපයන දත්ත විතරයි. නමුත් ඉදිරියේදී, කලින් තව තවත් ආයතන තමන්ගෙ datasets එයාලගෙ websites වල Google විසින් ලබා දීල තියෙන guidelines ආකාරයට describe කලොත්, dataset search engine එකේ coverage එක තවත් වැඩි වෙලා ගොඩක් ප්‍රයෝජනවත් tool එකක් බවට පත් වෙයි කියන එක Google researchers ල බලාපොරොත්තු වෙනව.

Dataset search engine එක භාවිතා කරන්න පුලුවන් භාෂා ගණනත් තවම සීමා සහිතයි. භාෂා වැඩි ගණනකට support එක ඉදිරියේදි ලැබෙනව කියන එක එයාලගෙ තවත් පොරොන්දුවක්.

 

Sources:

Google Blog
The Verge