#

summarization-dataset

Here are 19 public repositories matching this topic...

TransformerSum

HHousen / TransformerSum

Models to perform neural summarization (extractive and abstractive) using machine learning transformers and a tool to convert abstractive summarization datasets to the extractive task.

machine-learning text-summarization summarization albert extractive-summarization automatic-summarization bert roberta transformer-models pytorch-lightning distilbert summarization-dataset

Updated May 3, 2023
Python

csebuetnlp / xl-sum

This repository contains the code, data, and models of the paper titled "XL-Sum: Large-Scale Multilingual Abstractive Summarization for 44 Languages" published in Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021.

multilingual machine-learning deep-learning dataset text-summarization abstractive-text-summarization abstractive-summarization text-summarisation low-resource-languages multilinguality summarization-corpora summarization-dataset multilingual-text-summarization text-summarization-dataset text-summarization-model low-resource-summarization low-resource-text-summarizarion multilingual-summarization

Updated Mar 26, 2024
Python

IlyaGusev / gazeta

Gazeta: Dataset for automatic summarization of Russian news / Газета: набор данных для автоматического реферирования на русском языке

machine-learning dataset text-summarization summarization abstractive-text-summarization abstractive-summarization text-summarisation russian-language summarization-corpora summarization-dataset abstractive-summarization-dataset

Updated Oct 6, 2021
Python

rajdeep345 / ECTSum

Dataset and Codes for our EMNLP 2022 Main Conference Long Paper titled "ECTSum: A New Benchmark Dataset For Bullet Point Summarization of Long Earnings Call Transcripts"

benchmarking dataset summarization financial-data summarization-dataset

Updated May 22, 2024
Python

ziegler-ingo / CRAFT

Code, datasets, and checkpoints for the paper "CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation"

question-answering summarization corpus-data data-augmentation synthetic-data fine-tuning synthetic-dataset-generation question-answer-generation task-specific summarization-dataset large-language-models instruction-tuning

Updated Sep 15, 2024
Python

dennlinger / klexikon

Klexikon: A German Dataset for Joint Summarization and Simplification

german python3 german-language text-simplification summarization-dataset

Updated Oct 5, 2022
Python

amazon-science / abstractive-factual-tradeoff

Code and data for the Dreyer et al (2023) paper on abstractiveness and factuality in abstractive summarization

metrics summarization abstractive abstractive-summarization factuality summarization-dataset factuality-checking

Updated Jul 19, 2023
Python

nakhunchumpolsathien / ThaiCrossSum_Corpora

Thai Crosslingual Summarization Datasets.

summarization summarization-dataset crosslingual-summarization

Updated Feb 15, 2023
Jupyter Notebook

MohanKrishnaGR / Infosys_Text-Summarization

This repository contains the implementation of a Transformer-based model for abstractive text summarization and a rule-based approach for extractive text summarization.

deep-learning bart text-summarization automatic-summarization pytorch-nlp transformer-models summarization-dataset

Updated Jul 21, 2024
Jupyter Notebook

griff4692 / calibrating-summaries

This is the official PyTorch codebase for the ACL 2023 paper: "What are the Desired Characteristics of Calibration Sets? Identifying Correlates on Long Form Scientific Summarization".

nlp reinforcement-learning summarization model-calibration scientific-machine-learning summarization-dataset

Updated Aug 14, 2023
Python

tafseer-nayeem / BengaliSummarization

[EACL 2021] - Unsupervised Abstractive Summarization of Bengali Text Documents.

abstractive-summarization low-resource-languages bengali-nlp summarization-dataset bengali-summarization bengali-abstractive-summarization bengali-summarization-dataset

Updated Apr 26, 2021
Python

tafseer-nayeem / NeuFuse

[Computer Speech & Language, Elsevier] - Neural Sentence Fusion for Diversity Driven Abstractive Multi-Document Summarization.

multi-document-summarization abstractive-text-summarization abstractive-summarization sentence-fusion summarization-dataset neural-sentence-fusion abstractive-summarization-dataset

Updated Apr 6, 2021
Python

zenquiorra / M3LS

M3LS : Multi-lingual Multi-modal summarization dataset

nlp machine-learning multi-lingual multi-modal large-scale-dataset summarization-dataset

Updated Dec 7, 2023
Python

BaseMax / DeepSummarizationNLP

In deep learning NLP, using a model we are trying to summarization the text.

python deep-neural-networks deep-learning neural-network summarization summarization-algorithm summarization-dataset

Updated Mar 25, 2022
Python

plandes / cnndmdb

CNN/DailyMail Dataset as SQLite

nlp sqlite3 summarization-dataset

Updated Dec 4, 2023
Python

giganttheo / tib-dataset

Dataset for abstractive summarization of long multimodal presentations

multimodal-deep-learning summarization-dataset

Updated Sep 25, 2023

KDM-LAB / iCOPERNICUS-EMNLP24

This repository contains evaluation script for all the LLMs evaluated with iCOPERNICUS for testing In-Context Personalization Learning w.r.t summarization

personalization summarization summarization-dataset in-context-learning summarization-evaluation

Updated Oct 1, 2024
Jupyter Notebook

theQuert / COVID-Tweets-Summ

Speciﬁc-Aspect Summarization on News According to Social Sentiments on Twitter

social-media tweets social-network summarization tweets-extraction social-media-analysis summarization-algorithm covid-19 summarization-dataset

Updated Nov 26, 2022
HTML

DevKhizerer / T5_Summarizer

Using T5-Small and fine-tuning it using BBC's article summarization dataset.

machine-learning fine-tuning huggingface-transformers summarization-dataset huggingface-datasets generative-ai

Updated Aug 2, 2024
Jupyter Notebook

Improve this page

Add a description, image, and links to the summarization-dataset topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the summarization-dataset topic, visit your repo's landing page and select "manage topics."