Mis on Teksti kokkuvõtmine
Automaatne kokkuvõtete loomine
Teksti kokkuvõtmine on NLP-ülesanne teksti tihendatud versiooni automaatseks loomiseks, säilitades võtmeteabe.
Lähenemisviisid
- Ekstraktiivne — oluliste lausete valimine lähtetekstist
- Abstraktiivne — uute lausete genereerimine tähenduse põhjal
- Hübriidne — mõlema lähenemisviisi kombinatsioon
Meetodid
- Klassikalised — TF-IDF, TextRank, LSA
- Neuraalsed — Seq2Seq, tähelepanumehhanismid
- Kaasaegsed — BART, T5, GPT, Pegasus
Ärirakendused
- Automaatsed uudiste kokkuvõtted
- Aruannete ja dokumentide kokkuvõtmine
- E-posti lõimede kokkuvõtted
- Artiklite kokkusurumine eelvaadete jaoks
- Juhtide kokkuvõtete ettevalmistamine
Kvaliteedimõõdikud
- ROUGE — n-grammi võrdlus viitega
- BLEU — teksti genereerimise kvaliteet
- BERTScore — semantiline sarnasus