Kratijupid
Kratijupp on tehisintellektil põhineva rakenduse ehk krati baaskomponent, mida saavad tasuta taaskasutada ja vastavalt oma vajadustele edasi arendada kõik avaliku ja ka erasektori huvilised.
Kratijuppide tööriistakast annab ülevaate avalikustatud kratijuppidest, mis on kättesaadavad e-riigi koodivaramus ja/või GitHubis.
BÃœROKRATT
Bürokratt on avaliku sektori asutuste veebilehtedel olevate juturobotite koosvõimeline võrgustik, mis võimaldab inimesel asutustelt vestlusakna kaudu infot saada ja ka lihtsamaid teenuseid tarbida. Kogu arendustöö on avalik ja leitav GitHubist.
ANONÜMISEERIJA
Anonümiseerijal on võimekus tuvastada tekstist isikuandmete olemid (nt isikute nimed, isikukoodid, kuupäevad ja asukohad). Lisaks tuvastatakse organisatsioonide, toodete, teoste, sündmuste, ametikohtade ja rahaliste väljundite olemid. Pärast tuvastust suudab Anonümiseerija asendada selle mõne teise sama olemiklassi väärtusega (nt asendatakse Tallinna olem Tartuga). Kõik asutused, kus tuleb isikuandmeid töödelda, ja eriti need, kellel on kohustus andmeid avaldada, saavad siit kasu lõigata. Kõige suurem efekt tuleb teksti töötlemisel, mida peaks muidu käsitsi üle kontrollima.
Liidestunud kliendid saavad kasutada rakendust nii Tartu Ülikooli arendatud NER korpuste baasil kui ka täiendavalt treenida korpust asutusespetsiifiliste andmestikega. Tutvu demoga. Kogu arendustöö on avalik ja leitav GitHubist.
NEUROTÕLGE
Tartu Ülikooli keeletehnoloogia uurimisrühma arendatud tõlkemootorit Neurotõlge saavad masintõlkeks tasuta taaskasutada ja vastavalt oma vajadustele edasi arendada kõik huvilised. Neurotõlge toetab seitset keelt (eesti/läti/leedu/inglise/soome/saksa/vene), kusjuures kõik 42 tõlkesuunda mahuvad ühe närvivõrkudel põhineva mudeli sisse. Lahenduse puhul ei ole vaja sisendkeelt eraldi valida, vaid seda teeb süsteem ise, kasutajal tuleb valida vaid väljundkeel. Lisaks on võimalik valida ka tõlke stiili, olgu see siis kõnekeel või ametlikum tõlge. Lisaks suudab tõlkemootor ka samas keeles stiili kohendada ja parandada kirjavigu.
Tõlkemootori lahendus on võimalik paigutada endale sobivasse keskkonda, mis võimaldab seeläbi tõlkida ka asutusesiseseks kasutamiseks mõeldud dokumente. Tõlkemootor töötab veebis, kus saab seda kasutada nii otse demona, integreerida tõlkeraamistikega kui ka kasutada läbi API. Tõlkemootori lahendus on leitav riiklikust koodivaramust.
NEUROKÕNE
Tegemist on Tartu Ülikooli keeletehnoloogia uurimisrühma poolt välja arendatud eestikeelse närvivõrkudel põhineva kõnesünteesi prototüübiga, mis on treenitud eestikeelsete uudiste korpusel. Kõnesüntees oskab hetkel jäljendada kuue erineva kõneleja häält. Projekt on alles arendusjärgus ja kaugeltki mitte perfektne, aga närvivõrkudel põhinev kõnesüntees kõlab loomulikumalt kui varasemad meetodid. Kõnemudeli tugevusteks on kõne loomulik kõla ja intonatsioon, numbrite, sümbolite ja lühendite hääldamine.
Täpsem info on leitav aadressil www.neurokone.ee
Lähtekood koos paigaldusjuhendiga on kättesaadav GitHubis.
TEXTA TOOLKIT
Texta OÜ loodud tekstianalüütika töövahendit on oma tööprotsesside tõhustamiseks ja rutiinsete tegevuste automatiseerimiseks tänaseks kasutanud juba mitmed asutused. Näiteks Haridus- ja Teadusministeerium viis Texta tööriista abil läbi dokumendihalduse auditi, mille eesmärk oli tuvastada dokumendid, mis olid lubamatult avalikustatud (nt asutusesisesed dokumendid, isikuandmed jm). Justiitsministeerium koostöös Registrite ja Infosüsteemide Keskusega eemaldas Textaga ligi 80 000 kustunud karistusega kohtulahendist isikuandmed ja avalikustas need seejärel uuesti kohtute infosüsteemis. Texta Toolkit kasvas välja rakendusuuringutest STACCis ning selle arendust on toetatud ka Eesti Keeletehnoloogia programmist.
​Texta Toolkit on kättesaadav GitHubis.
KIIRKIRJUTAJA
Kõnetuvastus on tehnoloogia, mille abil muudetakse kõne tekstiks. Kõnetuvastus võimaldab näiteks dokumentide dikteerimist, kõne- ja videosalvestuste transkribeerimist ning kõne abil arvutite ja seadmetega suhtlemist. Eestikeelne kõnetuvastus on jõudnud reaalsete rakendusteni, mida kasutavad näiteks Põhja-Eesti Regionaalhaigla radioloogid, samuti mitmed Eesti meediamonitooringufirmad raadio- ja telesaadete automaatseks transkribeerimiseks. Hiljuti jõudis kõnetuvastus Riigikogu saali, kus luuakse kõnetuvastuse abil automaatselt stenogramme.
TalTechi keeletehnoloogia laboris väljatöötatud kiirkirjutaja on tasuta kõigile kättesaadav. Süsteemi arendab Tanel Alumäe juhitav töörühm. Lähtekood koos paigaldusjuhendiga on kättesaadav GitHubis.