LT EN
TokenMill

TokenMill

TokenMill – tai Lietuvos įmonė, įkurta 2012 m., besispecializuojanti teksto analizėje ir vertikalioje tekstų paieškoje surandant, rūšiuojant ir ištraukiant paslėptas mintis tekstuose.
Daugybė informacijos yra pateikiama dokumentuose, straipsniuose, elektroninio pašto žinutėse ar panašiuose tekstuose. Tokiuose dokumentuose esanti informacija ar jos dalis perteikiama kaip slapti duomenys ar turintys kitą, slaptą prasmę.

TokenMill padeda klientams rasti ir analizuoti vertingą tekstinę informaciją, kuri padeda klientams priimti teisingus sprendimus ir pagerinti verslo procesą. TokenMill padeda klientams apdoroti didelius tekstinių duomenų kiekius ar nustatyti tekstinio srauto intensyvumą.
TokenMill kuria ir plėtoja automatizuotus apdorojimo įrankius, padedančius aptikti, suprasti, analizuoti ir stebėti tendencijas didžiuliame informacijos kiekyje. Siekiant išspręsti su didelių duomenų kiekių apdorojimu ir su teksto analize susijusias problemas,  TokenMill naudoja natūralios kalbos apdorojimo, teksto analizės, mašinos išmokimo technikas. Todėl įmonė daugiausia dirba su GATE, UIMA, OpenNLP, Mahout, Nutch, Lucene ir panašiais programiniais įrankiais, kad galėtų pasiūlyti klientams stabilius ir lengvai palaikomus sprendimus.
TokenMill sukurti sprendimai yra taikomi tokiose srityse kaip:
    •    Media stebėsenai
    •    Vartotojų pagalbai teikti
    •    Įmonių paieškoje
    •    Ad hoc verslo analizėje
    •    Bet kur kitur, kur sutinkami tekstiniai duomenys
Įmonės kuriami produktai pasižymi tokiais funkcionalumais:
    •    Vieningas išrinkimas dokumentuose – greitas, paprastas ir vieningas priėjimas prie duomenų;
    •    Konteksto suvokimas – išrinkimas pagal užduotas savybes (kriterijus) ir pagal faktus naudojant natūralios kalbos apdorojimą;
    •    Daugiafiltrinė paieška ir informacijos reitingavimas/ prioritetizavimas – informacijos grupavimas į iš anksto apibrėžtas grupes ir informacijos prioritetizavimas pagal svarbą.
Tekstinės informacijos apdorojimui naudojamos įvairios technikos:
    •    Lingvistinės – morfologinė ir struktūrinė teksto analizė, aptikimas pagal gramatikos apspręstas savybes;
    •    Statistinės, mašinos išmokimo ir dirbtinio intelekto – paskirstymas, klasifikacija, klasterizavimas ir matmenų sumažinimas.

TokenMill specializuojasi tokiose specifinėse srityse kaip informacijos išrinkimas, natūralios kalbos apdorojimas, įmonės vardo atpažinimas, sentimentų analizė. Tam naudojami tokie pagrindiniai komponentai:
    •    Įmonės vardo atpažinimas, leidžiantis nustatyti svarbius faktus – nuo asmenų ir vietovių iki medicininės būklės simptomų;
    •    Ryšių tarp įmonių nustatymas, padedantis identifikuoti įvykius ir sąryšį tarp jų;
    •    Panašių pagal temas ir objektą dokumentų identifikavimas ir grupavimas pagal tai;
    •    Sentimentų analizė, nuomones atspindinčių dokumentų išrinkimas bei nuomonių, išreikštų dokumentuose, išrinkimas;
    •    Duomenų integracija leidžianti sklandžiai integruoti struktūruotus ir nestruktūruotus duomenis.
L3CE bendradarbiauja su TokenMill nuo pat savo veiklos pradžios, pirmiausiai kuriant automatizuotus sprendimus, skirtus netolerancijos paraiškoms internete aptikti ir apdoroti.
Daugiau http://www.tokenmill.lt/