对于关键词网络模块,提供了两种形式的调用,一是对于给定的关键词,生成完整的关键词网络图,二是对于只给出与关键词关联度最高的20只股票组合,他们分别是: ▲ WordNet.py ??完整关键词网络图 ▲ WordNet_stock.py ??关键词关联股票组合
三、 模块运行
1) 爬虫模块举例2个,其余不再呈现 路径: D:\TotalCode\LuceneCode\GetData\GetGuba_pylucene.py 功能: 股票论坛网页爬虫 输入参数:无 运行举例: python ? GetGuba_pylucene.py
运行过程实例:
运行结果:
路径:?D:\TotalCode\LuceneCode\GetData\GetSinaNews_pyl 功能: 个股新闻网页爬虫 输入参数:无 运行举例:?python ? GetGuba_pylucene.py
运行过程实例:
运行结果:
2) 检索模块 路径:?D:\TotalCode\LuceneCode\Index_Search\IndexFiles_pylucene.py 功能: 增量建立索引 输入参数:<数据目录> <索引目录> <开始日期> <结束日期> 运行举例:python IndexFiles_pylucene.py D:\DATA\text D:\DATA\Index\text 20120715 20120820
运行过程实例:
运行结果:
路径:?D:\TotalCode\LuceneCode\Index_Search\SearchFiles_pylucene.py 功能: 关键词全文检索 输入参数:<索引目录> <关键词> <输出文件> 运行举例:python SearchFiles_pylucene.py D:\DATA\Index\text "页岩气 "
D:\TotalCode\LuceneCode\Index_Search\Output_pylucene.txt
运行过程实例:
3)统计模块举例1个,其余不再呈现 路径:?D:\TotalCode\LuceneCode\ICTCLAS_Cal/IDFCal.py 功能: 计算关键词所在文档数 输入参数:<数据源> <开始日期> <结束日期> 运行举例:python IDFCal.py 股票论坛 20120715 20120820
运行过程实例:
运行结果:
4)关键词词频模块举例1个,其余不再呈现 路径:?D:\TotalCode\LuceneCode\ICTCLAS_ IDF/ sigWordSeq.py 功能:?关键词词频时间序列 输入参数:<数据源> <关键词> <股票代码> <开始日期> <结束日期> <是否搜索标识> 运行举例:python sigWordSeq.py 股票论坛 "物联网" 000001 20100601?20120820 1
运行过程实例:
运行结果:
路径:D:\TotalCode\LuceneCode\ICTCLAS_ IDF/ WordNet.py 功能:?完整关键词网络图 输入参数:<数据源> <关键词> <开始日期> <结束日期> 运行举例:python WordNet.py 研究报告 "页岩气" 20120601 20120817 运行过程实例:
【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。
|