क्या है टेक्स्ट सारांशीकरण
स्वचालित सारांश निर्माण
टेक्स्ट सारांशीकरण मुख्य जानकारी को संरक्षित करते हुए टेक्स्ट का संक्षिप्त संस्करण स्वचालित रूप से बनाने का एक NLP कार्य है।
दृष्टिकोण
- एक्सट्रैक्टिव — स्रोत टेक्स्ट से महत्वपूर्ण वाक्यों का चयन
- एब्स्ट्रैक्टिव — अर्थ के आधार पर नए वाक्य उत्पन्न करना
- हाइब्रिड — दोनों दृष्टिकोणों का संयोजन
विधियाँ
- पारंपरिक — TF-IDF, TextRank, LSA
- न्यूरल — Seq2Seq, Attention तंत्र
- आधुनिक — BART, T5, GPT, Pegasus
व्यावसायिक अनुप्रयोग
- स्वचालित समाचार डाइजेस्ट
- रिपोर्ट और दस्तावेज़ सारांश
- ईमेल थ्रेड सारांश
- पूर्वावलोकन के लिए लेख संपीड़न
- कार्यकारी सारांश तैयारी
गुणवत्ता मेट्रिक्स
- ROUGE — संदर्भ के साथ n-gram तुलना
- BLEU — टेक्स्ट जनरेशन गुणवत्ता
- BERTScore — शब्दार्थ समानता