Gvido Navicko specialybė taip ir vadinasi – duomenų mokslininkas. Jis tapo tuo žmogumi, kuris surenka „Tele 2“ vartotojų 4G internete sukurtą duomenų srautą ir perduoda jį mūsų unikalų muzikos instrumentą valdančiam kompiuteriui.
Apie tai, kokių tam prireikė įgūdžių bei kokias kliūtis teko įveikti, ir kalbėjomės su „Tele 2“ duomenų mokslininku. Tiesa, natų instrumentui, kuriuo groja internetas, parinkimas toli gražu nėra svarbiausia jo pareiga. Juk žmogus, kuris žiūrėdamas į duomenis moka atspėti ateitį, gali daug papasakoti.
Suskambę terabaitai
– Jūsų darbas – tai matematika?
– Iš esmės – taip. Bet vien matematikos neužtenka – reikia išmanyti ir IT, ir verslą. Dažnai reikia programuoti. Nes kas yra duomenų mokslas? Gauni kažkokius duomenų paketus ir visuomet turi pritaikyti kokį nors algoritmą, programą, kuri iš ten atrinktų reikiamus skaičius. Net jei tai – elementariausia statistika. Galiausiai, net kai jau gaunu reikiamus duomenis, pavyzdžiui, kad keisis kurių nors klientų poreikiai, turiu sukurti programinį sprendimą, kuris mano duomenis leis sėkmingai panaudoti kitiems.
– Kažką panašaus reikėjo daryti ir sulaukus prašymo pateikti „Tele2“ vartotojų išnaudojamų 4G duomenų srautą, kad jį būtų galima paversti muzika?
– Užduotis skambėjo labai labai paprastai. Reikia interneto srauto duomenų. Itin abstraktu. Po to jau išgryninome idėją, kad visgi reikia ne viso srauto, domina būtent 4G srautas. Tada išsiaiškinome, kas yra tie duomenys. Mes, pavyzdžiui, interneto duomenis matome sesijos lygmenyje. Nuo momento, kada klientas pradeda naudotis internetu, iki kol baigia. Ir per tą laiką fiksuojami įvairiausi parametrai: prie kokių bazinių stočių jungtasi ir t.t.
Kiekvienas prisijungimas – kaip atskiras siūlas. Grubiai tariant, nurodau mūsų duomenų bazei: „Duok man visus interneto duomenis, kurie naudoti Lietuvoje ir yra 4G.“ Gaunu duomenis su daugybe visokių pašalinių parametrų (telefono IMEI kodas ir t.t.). Vienos dienos 4G prisijungimus aprašantis failas siekia 1,3 GB. Įsivaizduoji, kiek ten visko.
Todėl jį vėlgi reikia filtruoti, po to iš individualių siūlų suvyti bendrą duomenų virvę ir tada viską pateikti padalinus ne sesijomis, o sekundėmis. Per dieną „Tele2“ interneto vartotojai vidutiniškai sunaudoja 150 terabaitų duomenų, tad neplona išeina virvutė.
– Atrodo, buvo daugiau darbo, negu galėtum pagalvoti. Tačiau kartą viską sureguliavus dabar duomenų teikimas vyksta automatiškai?
– Iš esmės – taip. Tiesiog perduodant duomenis trečiai šaliai, šiuo atveju instrumentą kūrusiems menininkams, reikia užtikrinti, kad tai vyktų saugiai. Dabar jie negali niekaip pamatyti, koks žmogus kiek duomenų naudojo. Mato tik visus dienos prisijungimus, bet be jokių numerių. Pavyzdžiui, vakar „Tele2“ tinkle mažiausiai buvo prisijungę 386345, o daugiausiai – 400809. Šį skaičių instrumentas ir mato, jis ir nulemia muzikos skambėjimo intensyvumą.
– Instaliacijoje instrumentas groja keturias natas, kurios atitinka keturias Lietuvos dalis – šiaurę, vakarus, pietus ir rytus. Šį padalinimą irgi darėte jūs?
– Tai labai paprasta. Kiekviena duomenų sesija įrašo ir „Tele 2“ bazinės stoties, per kurią ji vyko, parametrus. Tuomet jau iš kitos duomenų bazės randame tos stoties koordinates, o jau pagal ilgumą ir platumą labai lengva padalinti, kuri stotis kurioje Lietuvos dalyje yra. Taigi kurioje Lietuvos daly pradedi savo sesiją, už tą Lietuvos dalį ir groji. Aišku, aktyviausiai „Tele 2“ mobiliuoju internetu naudojamasi Vilniuje, Kaune, Klaipėdoje, Šiauliuose ir t.t. Tačiau gal įdomu, kad aštunti pagal aktyvumą yra kretingiškiai, devinti – Trakų gyventojai, o dešimtą vietą Lietuvoje šiuo metu užima Jonava.
Ateities prognozė – duomenys
Iš esmės pagrindinis duomenų mokslininko darbas „Tele 2“ yra užtikrinti, kad klientai būtų laimingi. Tai reiškia iš visų duomenų atrinkti tuos, kurie nurodo, kurie klientai kuo nepatenkinti, kam ir kodėl gali kilti noras kažką keisti, kas ir kokių paslaugų daugiau nori, kiek yra pasiryžęs už tai mokėti.
Užduotys labai konkrečios ir labai skirtingos, bet visos reikalauja vienaip ar kitaip nuspėti ateitį. Tačiau duomenų mokslas tuo ir skiriasi nuo raganystės, kad spėlioti čia nieko nereikia – pakanka teisingai perskaityti turimus duomenis ir rasi atsakymą. Nes ateitis jau įrašyta praeityje, būsimi mūsų poelgiai nuspėjami, žinant kaip elgėmės anksčiau.
Kokių dar dalykų apie ateitį žino duomenų mokslininkas Gvidas Navickas?
– Šį darbą jau dirbu ketverius metus, pradėjau, kai dar nė 4G nebuvo. Ir dabar matau, kaip viskas auga. Kiek, kur ir kodėl naršo žmonės, kokias svetaines jie lanko, mes matyti negalime. Tačiau matome, kad dabar 4G interneto vartojimas auga net ne procentais, o kartais. Ir tas augimas vis greitėja, tad, akivaizdu, ateity duomenų reikės ženkliai daugiau. Viską lemia greitis. Kai reikėjo ilgai laukti, kol užsikraus, žmonės mobiliu internetu beveik nežiūrėjo video, o dabar tą video žiūri aukščiausia raiška. Video turinio vis daugėja ir žmonės jį vis noriau žiūri išmaniajame telefone. Be to, kaip tik dabar labai auga ir išmaniųjų telefonų kiekis. Dabar per tris ketvirtadalius visų išmaniųjų yra 4G.
– Tai iš viso to galima spėti, kad lietuvių gyvenimas gerėja, o ateity jie gyvens dar geriau?
– Panašu, kad taip. Štai, po euro įvedimo buvo labai griežtai sekama, kad kainos būtų perskaičiuotos tiksliai, kad jos nekiltų. Ir ligi šiol dar yra daugybė įkainių, kurie „Tele 2“ išliko lygiai tokie, kokie buvo litais. Tačiau dabar nuolat auga, pavyzdžiui, neribotų pokalbių paslaugos užsakymai. Vadinasi, žmonėms keli eurai nebėra „kažkas tokio“, kad jie juos taupydami skaičiuotų savo pokalbių minutes. Lietuviams gerų paslaugų kaina jau priimtina, taigi išties gyvename geriau.
Be to, matome, kad vis daugiau žmonių aktyviai atnaujina savo įrenginius. Nesvarbu, kad „Samsung Galaxy S7“ dar geras, jei atsirado „S8“ – jie jį perka. Kol kas tai, aišku, ne didžioji dalis klientų, tačiau jau ir nebe vienetai. Tai, manau, irgi parodo, kad lietuvių perkamoji galia yra ir ji auga.
Ir sunaudojami duomenys, atrodo, visai nepaiso emigracijos – jie tik auga. Dar prieš kelis metus buvo taip, kad vos ne pusė išmaniųjų telefonų savininkų nenaudojo mobiliųjų duomenų, o dabar toji proporcija staigiai kinta. Nemokėję – išmoko, nenorėję – užsimanė, taupę suprato naudą, tad nenaudojančių nebelieka.
– Gyvename taip gerai ir taip greitai, kad per savaitę „Tele2“ klientai sunaudoja 1 PB (petabaitą) duomenų. Ir tas skaičius beprotiškai greitai auga. Visų tų duomenų nešamą informaciją galima panaudoti ir kuriant patogesnes paslaugas visiems piliečiams. Ar tai jau daroma?
– Jau yra tokių projektų. Juk grynai pagal naudojamų duomenų srautus galima nustatyti, kur yra didesnis žmonių susitelkimas, kur reikia dar vieno šviesoforo ar autobuso stotelės, ar pakaks maisto festivalio dalyviams ir t.t. Visa tai jau įmanoma ir vis labiau naudojama. Augantis daiktų internetas tokių duomenų pateiks dar daugiau, o atėjus 5G ryšiui jie taps tokiais išsamiais, kad pasitelkęs juos kompiuteris galės pateikti tikslią rekomendaciją bet kokios svarbos sprendimams. Ir tai nėra ateities spėjimas – duomenų mokslas ateitį apskaičiuoja.
Išgirsti, kaip skamba 4G muzika, galite užsukę į galeriją „TSEKH“ (Vilnius, Vytenio g. 6).