Doktoraten

We willen jullie informeren over meerdere onderzoekstrajecten die verbonden zijn aan DEMAND. We zullen dit nog verder gaan uitbouwen en meerdere gaan toevoegen.

Wat gebeurt er als collega’s hetzelfde woord gebruiken, maar iets anders bedoelen? Volgens Swarupa Hardikar, onderzoeker bij het lectoraat Data & Knowledge Engineering van de HAN en promovendus, ligt daar een onderschat risico voor organisaties. Misverstanden over termen, concepten en afkortingen kunnen leiden tot verkeerde interpretaties van data en uiteindelijk tot minder goede besluiten.

Hardikar ontwikkelt daarom een toolkit die datamanagers helpt inzicht te krijgen in de manier waarop begrippen binnen hun organisatie daadwerkelijk worden gebruikt. Met technieken als textmining en concept mining onderzoekt zij hoe medewerkers betekenis geven aan termen in hun dagelijkse werk. Daarbij kijkt zij niet alleen naar officiële definities, maar juist ook naar de taal die mensen in de praktijk gebruiken.

Binnen de DEMAND Semantics-werkgroep toetst Hardikar haar onderzoek aan praktijkervaringen van data professionals. Uit interviews met werkgroepleden bleek dat datamanagers behoefte hebben aan ondersteuning bij het herkennen van dubbelzinnigheden in data en communicatie. Een actueel onderzoeksproject, uitgevoerd in samenwerking met Alliander, richt zich op het automatisch herkennen van de juiste betekenis van afkortingen. Zo kan de afkorting IP bijvoorbeeld verwijzen naar Internet Protocol of Intellectual Property. Voor mensen is het onderscheid vaak vanzelfsprekend, maar voor AI-systemen en chatbots vormt dit een uitdaging.

Met haar onderzoek wil Hardikar organisaties helpen om taal, data en technologie beter op elkaar af te stemmen. Daarmee draagt zij bij aan transparantere communicatie, betrouwbaardere data en betere besluitvorming. Bovendien ziet zij kansen om deze aanpak in de toekomst ook toe te passen binnen het onderwijs, waar dezelfde begrippen vaak verschillend worden gebruikt door instellingen en professionals.

Binnen de DEMAND Semantics-werkgroep deelt zij regelmatig haar bevindingen. Later dit jaar presenteert zij de resultaten van haar experimenten rond acroniemdisambiguatie. Daarnaast staat zij open voor gesprekken met professionals die werken met ongestructureerde data en vergelijkbare uitdagingen ervaren.

nl_NL