English Version: Program target:
- read a determined column of form (xlsx) with sentence
- change the format to 'array'
- delete the sapce (Chinses only) and line breaks in the 'array'
- (Chinese only) depart diffierent words
- delete the stopping words (if you use English, you should find a stopping words list by yourself, I just provide some simple words like 'a', 'an', 'the' in stopping words list.
- draw a wordscloud by 'wordcloud' and save it as a file 'WordsCloudOutPut.jpg'
Other notes:
- YOU HAVE TO CHANGE 'stopwordlist.txt' AND DELETE 'dictionary.txt' IF YOU DO NOT USE CHINESE !
- if there are anything wrong with the path, please change all relative path with absolute path.
- you should creat a folder named 'Output' before running this program.
- if this program helps you, please give me a star!
** ! PLEASE ! **
Chinese Version: 项目目标:
- 读取表格文件中特定的某一列;
- 将读入的表格数据的格式更改为“数组”;
- 删除“数组”中的空格(仅限中文)和换行符;
- (仅限中文)分开不同的词语
- 删除停用词(如果使用英语,应自行查找停用词列表,我只是提供一些简单的停用词。
- 通过“wordcloud”绘制词云并将其保存为文件“WordsCloudOutPut.jpg”
其他注意事项: 1.如果您不使用中文,则必须更改“停用词表.txt”并删除“字典.txt! 2.如果路径有问题,请用绝对路径替代所有相对路径。 3.在运行此程序之前,您应该创建一个名为“Output”的文件夹。 4.如果这个程序对你有帮助,请给我一颗星星! 5.作者是一个要出国留学的学生,及其需要star!! ** 作为一个需要star的学生,球球了呜呜 **
Versión en español (de Microsoft Translation):
- Lea una columna específica en el archivo de tabla;
- Cambie el formato de los datos de la tabla leída a "Array";
- Elimine los espacios (solo en chino) y los saltos de línea en "matriz";
- (Solo en chino) Separar diferentes palabras
- Elimine las palabras de parada (si usa inglés, debe buscar la lista de palabras de parada usted mismo, solo proporciono algunas palabras de parada simples.
- Dibuje una nube de palabras a través de "wordcloud" y guárdela como un archivo "WordsCloudOutPut.jpg"
Otras notas:
- Si no usa chino, debe cambiar el "Stop Word .txt" y eliminar el "diccionario .txt".
- Si hay un problema con la ruta, reemplace todas las rutas relativas con rutas absolutas.
- Antes de ejecutar este programa, debe crear una carpeta llamada "Salida".
- Si esta aplicación te ayuda, ¡dame una estrella! ** Como estudiante que necesita STAR, muchas gracias **
Русский (из перевода Microsoft): Цели проекта:
- Прочитайте определенный столбец в файле таблицы;
- Измените формат считываемых данных таблицы на "Массив";
- Удалите пробелы (только на китайском языке) и разрывы строк в "array";
- (только на китайском языке) Разделяйте разные слова
- Удалите стоп-слова (Если вы используете английский язык, вы должны сами искать список стоп-слов, я просто предоставляю несколько простых стоп-слов.
- Нарисуйте облако слов через "wordcloud" и сохраните его в виде файла "WordsCloudOutPut.jpg"
Другие примечания:
- Если вы не используете китайский язык, вы должны изменить «Stop Word .txt» и удалить «словарь .txt»!
- Если есть проблема с контуром, замените все относительные пути абсолютными путями.
- Перед запуском этой программы необходимо создать папку с именем "Output".
- Если это приложение поможет вам, пожалуйста, дайте мне звезду! ** Как студент, нуждающийся в STAR, большое спасибо **
Deutsch (von Microsoft Translation): Projektziele:
- Lesen Sie eine bestimmte Spalte in der Tabellendatei;
- Ändern Sie das Format der gelesenen Tabellendaten in "Array";
- Entfernen Sie Leerzeichen (nur Chinesisch) und Zeilenumbrüche in "Array";
- (Nur Chinesisch) Trennen Sie verschiedene Wörter
- Entfernen Sie Stoppwörter (Wenn Sie Englisch verwenden, sollten Sie die Liste der Stoppwörter selbst nachschlagen, ich stelle nur einige einfache Stoppwörter zur Verfügung.
- Zeichnen Sie eine Wortwolke über "wordcloud" und speichern Sie diese als Datei "WordsCloudOutPut.jpg"
Weitere Anmerkungen:
- Wenn Sie kein Chinesisch verwenden, müssen Sie das "Stop Word .txt" ändern und das "Wörterbuch .txt" entfernen!
- Wenn es ein Problem mit dem Pfad gibt, ersetzen Sie alle relativen Pfade durch absolute Pfade.
- Bevor Sie dieses Programm ausführen, sollten Sie einen Ordner mit dem Namen "Output" erstellen.
- Wenn diese App Ihnen hilft, geben Sie mir bitte einen Stern! ** Als Student, der STAR braucht, vielen Dank **