Здраво драги читатели!
Јас сум Горјан Бужаровски, а во оваа објава ќе читате за моите први два месеци во IBORN како Data Science практикант. Пред да ја започнам праксата бев дипломиран софтверски инженер на ФИНКИ со мало професионално искуство во развој на софтвер, но голема пасија за обработка на податоци и машинско учење. После овие два месеци успеав да ја материјализирам пасијата за Data Science во практични решенија за реални проблеми на нашите клиенти.
Првиот месец од праксата ми се состоеше од два дела. Првиот дел беше изучување на алатки и вештини кои ќе ми бидат потребни за изведување на праксата. Тука припаѓа учење на работа со Redmine и Git, пишување на софтверски барања како и следење на курсеви за работа со бази на податоци како PostgreSQL. Во вториот дел (поинтересниот), започнав со истражување и анализирање на податочното множество на еден од нашите клиенти, кое се сочинува од резервации на соби за сместувања во Исланд. На крајот од месецот успеав да научам нов метод за кластерирање на податоци според корелацијата на елементите која ја применив врз податоците од резервациите. Имав голема слобода во начинот на изведување на податочната анализа од мојот менторот. Комуникацијата со менторот и останатите членови на IBORN беше добра и покрај тоа што праксата се изведување од дома поради COVID-19.
Вториот месец започна со истражување на проблематиката за предвидување на резервации кои ќе бидат откажани во хотелиерската индустрија. Истражувањето се состоеше од собирање и читање на публикувани трудови на оваа проблематика. Се одлучив за решение кое користи ML модел за предвидување на резервации кои ќе бидат откажани. Следен чекор беше предпроцесирање на податоците за да ги припремиме за тренирање на моделот.
Предпроцесирањето се состоеше од избор на големината на податочното множество, селектирање на карактеристики кои ќе учествуваат во тренирање на моделот и избирање на тренирачки процес. Истренираниот модел на 72% од резервациите точно го предвиде нивниот исход, а 66% беа точни предвидувањата за резервациите кои нашиот модел ги предвиде дека ќе бидат откажани. Овие резултати покажаа дека карактеристиките кои ги избравме за тренирање на моделот имаат предвидлива моќ, што значи може да продолжиме со подобрување на моделот. Исто и за овој месец праксата се одвиваше од дома и имав постојана поддршка од мојот ментор и од IBORN за активностите кои ги изведував.
Овие два месеци ми помогнаа да совладам нови вештини и да ја зацврстам довербата во вештините кои ги имав. Со голема возбуда и мотивација ги чекам предизвиците кои следуваат во следниот месец.
Толку за сега, се читаме во некоја друга објава.
