Skip to content

An easy-used wordcloud program made by jieba and python with deleting stopping words and cutting words. it is very easy to use!!!! 支持中文的分词、停用词和词云制作!基于python的结巴jieba分词

License

Notifications You must be signed in to change notification settings

Muyu-Chen/WordCloud-a-easy-used-version

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

English Version: Program target:

  1. read a determined column of form (xlsx) with sentence
  2. change the format to 'array'
  3. delete the sapce (Chinses only) and line breaks in the 'array'
  4. (Chinese only) depart diffierent words
  5. delete the stopping words (if you use English, you should find a stopping words list by yourself, I just provide some simple words like 'a', 'an', 'the' in stopping words list.
  6. draw a wordscloud by 'wordcloud' and save it as a file 'WordsCloudOutPut.jpg'

WordsCloud

Other notes:

  1. YOU HAVE TO CHANGE 'stopwordlist.txt' AND DELETE 'dictionary.txt' IF YOU DO NOT USE CHINESE !
  2. if there are anything wrong with the path, please change all relative path with absolute path.
  3. you should creat a folder named 'Output' before running this program.
  4. if this program helps you, please give me a star!
    ** ! PLEASE ! **

Chinese Version: 项目目标:

  1. 读取表格文件中特定的某一列;
  2. 将读入的表格数据的格式更改为“数组”;
  3. 删除“数组”中的空格(仅限中文)和换行符;
  4. (仅限中文)分开不同的词语
  5. 删除停用词(如果使用英语,应自行查找停用词列表,我只是提供一些简单的停用词。
  6. 通过“wordcloud”绘制词云并将其保存为文件“WordsCloudOutPut.jpg”

其他注意事项: 1.如果您不使用中文,则必须更改“停用词表.txt”并删除“字典.txt! 2.如果路径有问题,请用绝对路径替代所有相对路径。 3.在运行此程序之前,您应该创建一个名为“Output”的文件夹。 4.如果这个程序对你有帮助,请给我一颗星星! 5.作者是一个要出国留学的学生,及其需要star!! ** 作为一个需要star的学生,球球了呜呜 **

Versión en español (de Microsoft Translation):

  1. Lea una columna específica en el archivo de tabla;
  2. Cambie el formato de los datos de la tabla leída a "Array";
  3. Elimine los espacios (solo en chino) y los saltos de línea en "matriz";
  4. (Solo en chino) Separar diferentes palabras
  5. Elimine las palabras de parada (si usa inglés, debe buscar la lista de palabras de parada usted mismo, solo proporciono algunas palabras de parada simples.
  6. Dibuje una nube de palabras a través de "wordcloud" y guárdela como un archivo "WordsCloudOutPut.jpg"

Otras notas:

  1. Si no usa chino, debe cambiar el "Stop Word .txt" y eliminar el "diccionario .txt".
  2. Si hay un problema con la ruta, reemplace todas las rutas relativas con rutas absolutas.
  3. Antes de ejecutar este programa, debe crear una carpeta llamada "Salida".
  4. Si esta aplicación te ayuda, ¡dame una estrella! ** Como estudiante que necesita STAR, muchas gracias **

Русский (из перевода Microsoft): Цели проекта:

  1. Прочитайте определенный столбец в файле таблицы;
  2. Измените формат считываемых данных таблицы на "Массив";
  3. Удалите пробелы (только на китайском языке) и разрывы строк в "array";
  4. (только на китайском языке) Разделяйте разные слова
  5. Удалите стоп-слова (Если вы используете английский язык, вы должны сами искать список стоп-слов, я просто предоставляю несколько простых стоп-слов.
  6. Нарисуйте облако слов через "wordcloud" и сохраните его в виде файла "WordsCloudOutPut.jpg"

Другие примечания:

  1. Если вы не используете китайский язык, вы должны изменить «Stop Word .txt» и удалить «словарь .txt»!
  2. Если есть проблема с контуром, замените все относительные пути абсолютными путями.
  3. Перед запуском этой программы необходимо создать папку с именем "Output".
  4. Если это приложение поможет вам, пожалуйста, дайте мне звезду! ** Как студент, нуждающийся в STAR, большое спасибо **

Deutsch (von Microsoft Translation): Projektziele:

  1. Lesen Sie eine bestimmte Spalte in der Tabellendatei;
  2. Ändern Sie das Format der gelesenen Tabellendaten in "Array";
  3. Entfernen Sie Leerzeichen (nur Chinesisch) und Zeilenumbrüche in "Array";
  4. (Nur Chinesisch) Trennen Sie verschiedene Wörter
  5. Entfernen Sie Stoppwörter (Wenn Sie Englisch verwenden, sollten Sie die Liste der Stoppwörter selbst nachschlagen, ich stelle nur einige einfache Stoppwörter zur Verfügung.
  6. Zeichnen Sie eine Wortwolke über "wordcloud" und speichern Sie diese als Datei "WordsCloudOutPut.jpg"

Weitere Anmerkungen:

  1. Wenn Sie kein Chinesisch verwenden, müssen Sie das "Stop Word .txt" ändern und das "Wörterbuch .txt" entfernen!
  2. Wenn es ein Problem mit dem Pfad gibt, ersetzen Sie alle relativen Pfade durch absolute Pfade.
  3. Bevor Sie dieses Programm ausführen, sollten Sie einen Ordner mit dem Namen "Output" erstellen.
  4. Wenn diese App Ihnen hilft, geben Sie mir bitte einen Stern! ** Als Student, der STAR braucht, vielen Dank **

About

An easy-used wordcloud program made by jieba and python with deleting stopping words and cutting words. it is very easy to use!!!! 支持中文的分词、停用词和词云制作!基于python的结巴jieba分词

Topics

Resources

License

Stars

Watchers

Forks

Languages