Vad är Textsammanfattning
Automatisk skapande av sammanfattningar
Textsammanfattning är en NLP-uppgift för att automatiskt skapa en kondenserad version av text samtidigt som nyckelinformation bevaras.
Tillvägagångssätt
- Extraktiv — val av viktiga meningar från källtexten
- Abstraktiv — generering av nya meningar baserat på betydelse
- Hybrid — kombination av båda tillvägagångssätten
Metoder
- Klassiska — TF-IDF, TextRank, LSA
- Neurala — Seq2Seq, Attention-mekanismer
- Moderna — BART, T5, GPT, Pegasus
Affärstillämpningar
- Automatiska nyhetssammanfattningar
- Sammanfattning av rapporter och dokument
- E-posttrådsammanfattningar
- Artikelkomprimering för förhandsvisningar
- Förberedelse av verkställande sammanfattningar
Kvalitetsmått
- ROUGE — n-gram-jämförelse med referens
- BLEU — textgenereringskvalitet
- BERTScore — semantisk likhet