gpt-2

Star

Here are 825 public repositories matching this topic...

Morizeyao / GPT2-Chinese

Star

Chinese version of GPT2 training code, using BERT tokenizer.

nlp text-generation transformer chinese gpt-2

Updated Apr 25, 2024
Python

NielsRogge / Transformers-Tutorials

Star

This repository contains demos I made with the Transformers library by HuggingFace.

transformers pytorch bert gpt-2 layoutlm vision-transformer

Updated Oct 21, 2024
Jupyter Notebook

EleutherAI / gpt-neo

Star

An implementation of model parallel GPT-2 and GPT-3-style models using the mesh-tensorflow library.

transformers gpt language-model gpt-2 gpt-3

Updated Feb 25, 2022
Python

RWKV is an RNN with transformer-level LLM performance. It can be directly trained like a GPT (parallelizable). So it's combining the best of RNN and transformer - great performance, fast inference, saves VRAM, fast training, "infinite" ctx_len, and free sentence embedding.

deep-learning transformers pytorch transformer lstm rnn gpt language-model attention-mechanism gpt-2 gpt-3 linear-attention rwkv chatgpt

Updated Nov 17, 2024
Python

microsoft / LoRA

Star

Code for loralib, an implementation of "LoRA: Low-Rank Adaptation of Large Language Models"

deep-learning pytorch lora language-model adaptation roberta low-rank gpt-2 gpt-3 deberta

Updated Aug 14, 2024
Python

yangjianxin1 / GPT2-chitchat

Star

GPT2 for Chinese chitchat/用于中文闲聊的GPT2模型(实现了DialoGPT的MMI思想)

nlp text-generation transformer gpt-2 gpt2 dialogpt chichat dialogue-model

Updated Oct 30, 2023
Python

dbiir / UER-py

Star

Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo

Updated May 9, 2024
Python

codota / TabNine

Star

AI Code Completions

Updated Jul 3, 2024
Shell

lonePatient / awesome-pretrained-chinese-nlp-models

Star

Awesome Pretrained Chinese NLP Models，高质量中文预训练模型&大模型&多模态模型&大语言模型集合

nlp dataset chinese gpt pretrained-models pangu bert multimodel roberta gpt-2 ernie xlnet nezha nlu-nlg simbert large-language-models llm

Updated Nov 15, 2024
Python

BrikerMan / Kashgari

Star

Kashgari is a production-level NLP Transfer learning framework built on top of tf.keras for text-labeling and text-classification, includes Word2Vec, BERT, and GPT2 Language Embedding.

nlp machine-learning text-classification named-entity-recognition seq2seq transfer-learning ner bert sequence-labeling nlp-framework bert-model text-labeling gpt-2

Updated Sep 3, 2024
Python

huggingface / transfer-learning-conv-ai

Star

🦄 State-of-the-Art Conversational AI with Transfer Learning

nlp deep-learning dialog pytorch neural-networks chatbots transfer-learning gpt gpt-2

Updated Jun 12, 2023
Python

mishl-dev / Discord-AI-Chatbot

Star

This Discord chatbot is incredibly versatile. Powered incredibly fast Groq API

Updated May 18, 2024
Python

jaymody / picoGPT

Star

An unnecessarily tiny implementation of GPT-2 in NumPy.

python nlp machine-learning deep-learning neural-network gpt gpt-2 large-language-models

Updated Apr 24, 2023
Python

asyml / texar

Star

Toolkit for Machine Learning, Natural Language Processing, and Text Generation, in TensorFlow. This is part of the CASL project: http://casl-project.ai/

python machine-learning natural-language-processing deep-learning tensorflow machine-translation text-generation data-processing bert text-data dialog-systems gpt-2 texar xlnet casl-project

Updated Aug 26, 2021
Python

microsoft / DialoGPT

Star

Large-scale pretraining for dialogue

machine-learning dialogue text-generation pytorch transformer data-processing text-data gpt-2 dialogpt

Updated Oct 17, 2022
Python

imcaspar / gpt2-ml

Star

GPT2 for Multiple Languages, including pretrained models. GPT2 多语言支持, 15亿参数中文预训练模型

nlp tensorflow text-generation colab chinese pretrained-models bert tpu gpt-2

Updated May 22, 2023
Python

FoundationVision / VAR

Star

[NeurIPS 2024 Oral][GPT beats diffusion🔥] [scaling laws in visual generation📈] Official impl. of "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction". An *ultra-simple, user-friendly yet state-of-the-art* codebase for autoregressive image generation!