前面谈了GibbLDA++的使用方法,这里记录一下JAVA版本的使用方法。



JGibbLDA代码下载页:https://sourceforge.net/projects/jgibblda/


首先下载代码,导入到ecplise工程,导入之后的目录树如图:



这里提供已经训练好的models:



我们要用自己的数据进行训练,首先在data文件夹放入需要训练的数据:

数据格式如下:


第一行为总文本数,每一行为一个文本,中文需要分词。


然后点击ecplise的run的run configurations使用有参数运行,如下图:




其他参数参照上一篇博客。