Tartu NLP

Tartu NLP Natural language processing research group at the Institute of Computer Science, University of Tartu

Yesterweek was a busy one for TartuNLP: our researchers were out sharing ideas, presenting their work, and representing ...
20/05/2026

Yesterweek was a busy one for TartuNLP: our researchers were out sharing ideas, presenting their work, and representing Estonian and Finno-Ugric NLP at international conferences 📚

At 𝐋𝐑𝐄𝐂 𝟐𝟎𝟐𝟔 in Palma de Mallorca, our team presented four papers:

🔹 "Estonian WinoGrande Dataset: Comparative Analysis of LLM Performance on Human and Machine Translation"
by Marii Ojastu, Hele-Andra Kuulmets, Aleksei Dorkin, Marika Borovikova, Dage Särg and Kairit Sirts

🔹 "Towards Consistent Detection of Cognitive Distortions: LLM-Based Annotation and Dataset-Agnostic Evaluation"
by Neha Sharma, Navneet Agarwal and Kairit Sirts

🔹 "Creation of the Estonian Subjectivity Dataset: Assessing the Degree of Subjectivity on a Scale"
by Karl Gustav Gailit, Kadri Muischnek and Kairit Sirts

🔹 "Document-Level Text Simplification in Estonian Using Large Language Models"
by Meeri-Ly Muru and Eduard Barbu

At the 𝐑𝐄𝐒𝐎𝐔𝐑𝐂𝐄𝐅𝐔𝐋-𝟐𝟎𝟐𝟔 workshop, Mark Fishel gave the keynote talk:
🎤 "Translating and modelling under-resourced languages and dialects, and how (not) to do it"

At the 𝐊𝐆-𝐋𝐋𝐌 @ 𝐋𝐑𝐄𝐂 𝟐𝟎𝟐𝟔 workshop, two papers were presented:

🔹 "ReX-GG: A LLM Ensemble Pipeline for Relation-extraction and Graph Generation"
by Giacomo Magnifico and Eduard Barbu

🔹 "Large Language Models for Knowledge Graph Extraction: A Schema-Constrained Evaluation Framework"
by Markus Ilves, Eduard Barbu and Jaan Übi

Meanwhile in Helsinki at 𝐈𝐅𝐔𝐒𝐂𝐎 𝐗𝐋𝐈, Britt-Kathleen Mere presented:

🔹 "Are We Low-Resource by Choice? Rethinking Finno-Ugric NLP"
(Title in Komi: "Лоам-ӧ ми "этша ресурса" асланым бӧрйӧмӧн? Финн-йӧгра NLP вылӧ мӧдног видзӧдлӧм")

From datasets to language models for under-resourced languages, we’re happy to see our researchers contributing to so many important conversations 🗣️💻

Eesti doktorikool tähistab 13. mail Euroopa doktorantide päeva. Sellega seoses avaldatakse selle nädala jooksul Eesti er...
11/05/2026

Eesti doktorikool tähistab 13. mail Euroopa doktorantide päeva. Sellega seoses avaldatakse selle nädala jooksul Eesti eri ülikoolides õppivate doktorantidega tehtud väikseid intervjuusid. Jagame rõõmuga oma doktorandi Taido Purasoni mõtteid oma uurimisvaldkonna ja doktorantuuri kohta!

👇

Eesti ülikoolide ühisprojekt Eesti doktorikool tähistab 13. mail Euroopa doktorantide päeva, mis kutsub arutlema doktorantuuri väärtuse üle.

10. juunil toimub TÜ Delta õppehoones konverents „Küberinnovatsioon 2026 Tartu”, mis keskendub seekord regulatsioonidele...
16/04/2026

10. juunil toimub TÜ Delta õppehoones konverents „Küberinnovatsioon 2026 Tartu”, mis keskendub seekord regulatsioonidele ⛔

Konverentsi päevakava on täidetud põnevate ettekannete ja töötubadega, teadusloengut peab aga meie oma 𝗞𝗮𝗶𝗿𝗶𝘁 𝗦𝗶𝗿𝘁𝘀, kes räägib suurte keelemudelite arendamisest ja rakendamisest regulatsioonide keerises.

Rohkem infot ⤵️

Masintõlge on jõudnud tasemele, kus seda hinnatakse juba omaette "olümpial".🤖 The Conference on Machine Translation (WMT...
14/04/2026

Masintõlge on jõudnud tasemele, kus seda hinnatakse juba omaette "olümpial".

🤖 The Conference on Machine Translation (WMT) toob igal aastal kokku maailma parimad mudelid: kes tõlgib kõige paremini?
2025. aastal võisteldi mh inglise-eesti keelepaari suunal. Eesti keel jõudis WMT-le esimest korda 2018. aastal.

Milline mudel on 2025. aasta seisuga parim tõlkija, kas masintõlge on parem kui inimtõlge ning kuidas üldse tõlke kvaliteeti hinnatakse?
👉 Neile küsimustele vastavad Geeniuse intervjuus prof 𝐌𝐚𝐫𝐤 𝐅𝐢𝐬̌𝐞𝐥 ning keeletehnoloogia teadur 𝐋𝐢𝐬𝐚 𝐘𝐚𝐧𝐤𝐨𝐯𝐬𝐤𝐚𝐲𝐚. Nemad, muide, olid WMT 2025 kaaskorraldajad ning töötasid usinalt selle nimel, et eesti keel oleks võistluses esindatud!

Loe intervjuud ⤵️

Igal aastal toimub masintõlke maailmas omamoodi olümpia. Rahvusvahelise masintõlke konverentsi The Conference on Machine Translation (WMT) raames pannakse stardijoonele erinevad tõlkesüsteemid üle maailma, et mõõta, kui hästi need päriselt toimivad ja kui kaugele masintõlge tänaseks jõu...

Hele-Andra värskelt kaitstud doktoritöö näitab, et ka väiksema andmehulgaga keelte (nagu eesti keel) jaoks on võimalik l...
10/04/2026

Hele-Andra värskelt kaitstud doktoritöö näitab, et ka väiksema andmehulgaga keelte (nagu eesti keel) jaoks on võimalik luua kvaliteetseid keelemudeleid.

Kuidas? Vastus peitub mitmekeelses siirdeõppes ehk lähenemises, kus ühe keele najal omandatud teadmisi kasutatakse teise keele mudelite arendamiseks.

Loe lähemalt Novaatorist ⤵️

Tartu Ülikoolis kaitstud doktoritöö näitas, et eestikeelseid tehisintellekti mudeleid saab arendada ka väheste andmetega, kui kasutada mitmekeelset siirdeõpet.

🧑‍🎓 Hele-Andra Kuulmets kaitses täna edukalt oma doktoritöö "Cross-Lingual Transfer Learning and Evaluation in Low-Resou...
09/04/2026

🧑‍🎓 Hele-Andra Kuulmets kaitses täna edukalt oma doktoritöö "Cross-Lingual Transfer Learning and Evaluation in Low-Resource Settings" (eesti keeles "Keeltevaheline siirdeõpe ja selle hindamine väheste ressurssidega oludes")!

Palju õnne ja tuult tiibadesse! 👏

Juba HOMME kaitseb 𝗛𝗲𝗹𝗲-𝗔𝗻𝗱𝗿𝗮 𝗞𝘂𝘂𝗹𝗺𝗲𝘁𝘀 oma doktoritööd "Cross-Lingual Transfer Learning and Evaluation in Low-Resource S...
08/04/2026

Juba HOMME kaitseb 𝗛𝗲𝗹𝗲-𝗔𝗻𝗱𝗿𝗮 𝗞𝘂𝘂𝗹𝗺𝗲𝘁𝘀 oma doktoritööd "Cross-Lingual Transfer Learning and Evaluation in Low-Resource Settings" ("Keeltevaheline siirdeõpe ja selle hindamine väheste ressurssidega oludes")! 🚀

Tulge kuulama!

🗓️ 9. aprill kell 11.00
📍 Narva mnt. 18, ruum 1021
---
Coming up TOMORROW, 𝗛𝗲𝗹𝗲-𝗔𝗻𝗱𝗿𝗮 𝗞𝘂𝘂𝗹𝗺𝗲𝘁𝘀 will defend her doctoral thesis "Cross-Lingual Transfer Learning and Evaluation in Low-Resource Settings"! 🚀

Come and join us to hear more about her research!

🗓️ April 9 at 11:00
📍 Narva mnt. 18, room 1021

9. aprillil kell 11.00 kaitseb 𝗛𝗲𝗹𝗲-𝗔𝗻𝗱𝗿𝗮 𝗞𝘂𝘂𝗹𝗺𝗲𝘁𝘀 oma doktoritööd "Cross-Lingual Transfer Learning and Evaluation in Low-Resource Settings" ("Keeltevaheline siirdeõpe ja selle hindamine väheste ressurssidega oludes")! 🚀 Hele-Andrat juhendab prof Mark Fišel, oponendid on prof Barbara Plank (Müncheni Ludwig Maximiliani Ülikool, Saksamaa) ja filosoofiadoktor Jindřich Helcl (Oslo Ülikool, Norra).

📍 Narva mnt. 18, ruum 1021
Zoomi link: https://ut-ee.zoom.us/j/99363730402?pwd=GhShv6BU7al8W8M9tWja2zKtbpJP6c.1
Kohtumise ID: 993 6373 0402
Pääsuvõti: ati

Leia töö PDF ja sisukokkuvõte siit: https://dspace.ut.ee/items/f7ddfa34-fdd6-43bf-bf7c-5cde3852e8a9
---
On April 9 at 11:00, 𝗛𝗲𝗹𝗲-𝗔𝗻𝗱𝗿𝗮 𝗞𝘂𝘂𝗹𝗺𝗲𝘁𝘀 will defend her doctoral thesis "Cross-Lingual Transfer Learning and Evaluation in Low-Resource Settings"! 🚀 Hele-Andra is supervised by Prof. Mark Fišel, her opponents are Prof. Barbara Plank (Ludwig-Maximilians-Universität München, Germany) and Dr. Jindřich Helcl (University of Oslo, Norway).

📍 Narva mnt. 18, room 1021
Zoom link: https://ut-ee.zoom.us/j/99363730402?pwd=GhShv6BU7al8W8M9tWja2zKtbpJP6c.1
Meeting ID: 993 6373 0402
Passcode: ati

Find the PDF and summary of the thesis here: https://dspace.ut.ee/items/f7ddfa34-fdd6-43bf-bf7c-5cde3852e8a9

9. aprillil kell 11.00 kaitseb 𝗛𝗲𝗹𝗲-𝗔𝗻𝗱𝗿𝗮 𝗞𝘂𝘂𝗹𝗺𝗲𝘁𝘀 oma doktoritööd "Cross-Lingual Transfer Learning and Evaluation in Lo...
20/03/2026

9. aprillil kell 11.00 kaitseb 𝗛𝗲𝗹𝗲-𝗔𝗻𝗱𝗿𝗮 𝗞𝘂𝘂𝗹𝗺𝗲𝘁𝘀 oma doktoritööd "Cross-Lingual Transfer Learning and Evaluation in Low-Resource Settings" ("Keeltevaheline siirdeõpe ja selle hindamine väheste ressurssidega oludes")! 🚀 Hele-Andrat juhendab prof Mark Fišel, oponendid on prof Barbara Plank (Müncheni Ludwig Maximiliani Ülikool, Saksamaa) ja filosoofiadoktor Jindřich Helcl (Oslo Ülikool, Norra).

📍 Narva mnt. 18, ruum 1021
Zoomi link: https://ut-ee.zoom.us/j/99363730402?pwd=GhShv6BU7al8W8M9tWja2zKtbpJP6c.1
Kohtumise ID: 993 6373 0402
Pääsuvõti: ati

Leia töö PDF ja sisukokkuvõte siit: https://dspace.ut.ee/items/f7ddfa34-fdd6-43bf-bf7c-5cde3852e8a9
---
On April 9 at 11:00, 𝗛𝗲𝗹𝗲-𝗔𝗻𝗱𝗿𝗮 𝗞𝘂𝘂𝗹𝗺𝗲𝘁𝘀 will defend her doctoral thesis "Cross-Lingual Transfer Learning and Evaluation in Low-Resource Settings"! 🚀 Hele-Andra is supervised by Prof. Mark Fišel, her opponents are Prof. Barbara Plank (Ludwig-Maximilians-Universität München, Germany) and Dr. Jindřich Helcl (University of Oslo, Norway).

📍 Narva mnt. 18, room 1021
Zoom link: https://ut-ee.zoom.us/j/99363730402?pwd=GhShv6BU7al8W8M9tWja2zKtbpJP6c.1
Meeting ID: 993 6373 0402
Passcode: ati

Find the PDF and summary of the thesis here: https://dspace.ut.ee/items/f7ddfa34-fdd6-43bf-bf7c-5cde3852e8a9

Kuidas mõjutab tehisaru terminitööd? 🤖30. jaanuaril toimus Eesti Maaülikoolis kümnes terminipäevak, mis kandis pealkirja...
12/03/2026

Kuidas mõjutab tehisaru terminitööd? 🤖

30. jaanuaril toimus Eesti Maaülikoolis kümnes terminipäevak, mis kandis pealkirja "Inimene-masin-süsteem terminitöös". Arutleti kolme termini- ja tõlketöö abivahendi üle: tehisaru, masintõlge ja tõlkeabiprogrammid. Päeva lõpetas ülevaade terminiteaduse ajaloost.

Terminipäevakul tutvustas TÜ arvutiteaduse instituudi keeletehnoloogia õppetooli juhataja ja professor 𝐌𝐚𝐫𝐤 𝐅𝐢š𝐞𝐥 Neurotõlke (👉 neurotolge.ee) programmi, millest võib kasu olla ka terminitöös. Samuti selgitas Mark, millised on tehisnärvivõrkudel põhineva masintõlke head ja vead.

📷 Vaata fotosid:
https://owncloud.ut.ee/owncloud/s/LAXqMYGLrk46L4J
🎥 Vaata salvestust:
https://video.emu.ee/terminipaevak-2026/

Terminipäevaku korraldajad ja päevajuhid on Ülle Sihver (Eesti Maaülikool), R**t Hendrikson (Kaitseväe Akadeemia) ja Helika Mäekivi (Tartu Ülikool). Terminipäevakut toetab Haridus- ja Teadusministeerium eestikeelse terminoloogia programmi kaudu.

Arutelu tehisaru oskuste üle eesti kontekstis jätkub.„AK. Nädalas“ selgitas asja keeletehnoloogia kaasprofessor 𝗞𝗮𝗶𝗿𝗶𝘁 𝗦...
11/03/2026

Arutelu tehisaru oskuste üle eesti kontekstis jätkub.
„AK. Nädalas“ selgitas asja keeletehnoloogia kaasprofessor 𝗞𝗮𝗶𝗿𝗶𝘁 𝗦𝗶𝗿𝘁𝘀.

Vaata lähemalt arvutiteaduse instituudi postitusest 👇

🎥„AK. Nädal“ uuris, mida mõistab tehisaru eesti keelest ja kultuurist. Teiste hulgas jagas oma mõtteid meie instituudi keeletehnoloogia kaasprofessor Kairit Sirts.🗨️

Vaata saatelõiku➡️ https://novaator.err.ee/media/video/f1112418caa8cdb1874081e111327025?contentId=1609961504
Loe Novaatorist kokkuvõtet➡️ https://novaator.err.ee/1609961504/ak-nadal-uuris-mida-moistab-tehisaru-eesti-keelest-ja-kultuurist

Address

Narva Mnt. 18
Tartu
51009

Alerts

Be the first to know and let us send you an email when Tartu NLP posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Share