Denna webbplats använder cookies för att ditt besök ska fungera bättre.

Vi använder enhetsidentifierare för att med hjälp av Google Analytics analysera vår trafik för att optimera innehållet på denna webbplats. Detta innebär också att vi vidarebefordrar identifierare och annan information från din enhet till Google. Läs mer

Dessa kan i sin tur kombinera informationen med annan information som du har tillhandahållit eller som de har samlat in när du har använt deras tjänster. Vill du inte att information skickas till Google så finns det sätt att blockera detta i din webbläsare. Vi använder även cookies för att förbättra användarupplevelsen. Du kan enkelt ta del av, blockera och avlägsna lagrade cookies om så önskas via inställningar i din webbläsare.

Acceptera alla cookies

Ser mönster i texter

Johanna Björklund har tilldelats ett anslag om 3 520 000 kronor som Ung Forskare av Vetenskapsrådet inom projektet Syntaktiska metoder för textklassificering. Johanna Björklund är forskare vid institutionen för datavetenskap, Umeå universitet, men även en av grundarna till it-företaget CodeMill.

Inom området Språkteknologi utforskar vetenskapare teorier och metoder för att med datorns hjälp bearbeta språklig information. En central uppgift är textklassificering. På en abstrakt nivå går det ut på att sortera in tidigare osedda dokument i olika kategorier. I praktiken kan det handla om att avgöra vem som har författat en novell, om ett mejl ska betraktas som spam eller inte, om en hemsida är skriven på engelska eller svenska, om en produktrecension är positiv, negativ eller neutral, eller om en uppsats är resultatet av plagiat.

I projektet Syntaktiska metoder för textklassificering vill Johanna Björklund tillsammans med sina forskarkollegor göra det lättare att använda syntaktiska stildrag för textklassificering. Målet är att ta fram metoder som berättar vilka syntaktiska mönster som är nyttiga för ett visst klassificeringsproblem. Forskarna vill även titta på hur man kan få en liten mängd träningsdata att räcka så långt som möjligt, och undersöka hur stor betydelse valet av syntaktisk teori har för hur väl ett klassificeringssystem presterar.

Ett lyckat projekt skulle innebära att man bättre förstår vilken syntaktisk information som är användbar vid olika klassificeringsproblem, och hur dessa ska kunna användas för att få så bra klassificeringssystem som möjligt. I praktiken kan det exempelvis ge mer information om upphovsmannen bakom ett antikt manuskript, eller harmonisera stilen i en artikel skriven av en grupp författare.

Sök till Uminova Innovation

Vi är alltid på jakt efter fler västerbottniska affärsidéer att boosta. Om du har en, som du tror på och inte kan släppa, så kan du ansöka om vårt affärsstöd. Det tar bara 10 minuter. Vi hör av oss till dig och berättar om och hur vi kan hjälpa dig bäst. Ps. Vi arbetar under full sekretess.