加拿大华人论坛 德国工作请问各位大牛,德语文本挖掘有什么傻瓜工具可
在加拿大
老板想找人分析email,看这几年客户的email出现了哪些关键词。。。
但是老板不懂什么技术,打算叫人一个一个把email读了,然后分类虽然任务还没有分配下来,但是可以肯定是我来做这事。。。
6年的email。这个数量不是开玩笑啊。。。
后来想到貌似有文本挖掘的工具,可惜我不是学这个的,查了下中文资料,发现中文有傻瓜工具,输进去就行了。。。
不知道有没有支持德语的傻瓜文本挖掘工具?
我唯一需要的功能,就是文字出现频率。。。
还是,文本挖掘,必须要先学习Python ?
求大牛们给我指一条明路,不求解决问题,只求一个方向。。。
评论
根据你的描述,你老板让你做的,
应该是最基础的 qualitative coding,
而并非你和其他几位所认为的 quantitative,
你具体要做的,叫作 grounded codes,
是文本分析和话语分析的一种,
属于社会科学的范畴(因为你是要分析人类的语言,而不是分析计算机代码),
所以一般用 NVivo!
评论
单击开链:
Data mining with R : learning with case studies
评论
着急的话,花点钱找个人就分析了。
不着急的话,Python是你的首选。 R在Data science领域肯定很强大,不过单是文本挖掘还是python稍微强一点,而且python比较容易上手。
最佳组合应该是Python提取信息, R 做machine leraning,特别是后续如果你需要建立预测模型,R 简直太强大了。
https://datawarrior.wordpress.co ... hon-on-text-mining/
PS: R python julia 号称Data science 新三剑客。。。
评论
非常非常感谢!现在去找python的资料
评论
书:
1. lerning python
2. Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
评论
免费数据挖掘软件:
单击开链:
weka
orange
评论
有很多词频统计软件,有免费的,收费的,淘宝上国人自己开发的也就几十元。只是德语,英语的词语有变形,要考虑一下。
·中文新闻 驻扎在北端地区的日本军队向中国发出明确信息
·中文新闻 Bluesky:社交媒体网站吸引了大量当地 X 难民