Siskin 深度语义分析引导的文字信息全流程处理—黄雀系统(semantic analysis for text mining):
- 采用先进的语义网模型对海量文字信息进行处理、建模、聚类、匹配、即时机器学习
- 先进的图形和表格及仪表盘可视化展示
- 实现精准推荐、舆情分析、热点发现、行为预测、关系追溯能功能。
- 适用于新闻传媒、电子商务、教材考题、专利检索、科技文献、招聘匹配、企业情报、个人智库等应用领域。
图-1 一篇资料的语义网模型 |
图-2 Siskin语义分析系统示范性前端 |
Siskin的检索功能:
- 直接用关键词搜索search-by-terms(非语义搜索)——搜索与词匹配的N篇资料
- 直接用资料搜索search-by-artifact(非语义搜索)——搜索与一篇资料字面匹配的N篇资料
- 用关键词作语义检索query——搜索含关键词语义匹配的资料,也用于验证资料库间匹配度
- 用资料作语义检索artifact-query——搜索与一份资料语义匹配的其他资料
- 用词作背景,以关键词作语义检索context-and-query——搜索与两个字语义匹配的资料
- 用资料作背景,以关键词作语义检索artifact-context-&-query——匹配二者的资料
- 用资料作背景,以目标资料作语义检索artifact-context-&-artifact-query——匹配二者的资料
- 即时机器学习(背景/个性学习)——real-time machine learning,强化个人需要的资料
- 广义语句的语义检索——匹配的广义语句,如物流货运(车-货匹配)中的“运输语句”
- 用部分资料作背景——预测其他资料,可实现“人类行为预测”
REST后端中转子系统——省掉API程序开发
- Siskin系统使用REST(REpresentation State Transfer)结构。
- REST描述了一个架构样式的网络系统,比如 web 应用程序。由于本系统使用了REST 交互,用户的商务逻辑中端通过HTTP方式调用语义分析服务,故不需安装任何API应用程序接口。
- 另外,REST 中转服务可以调用多台语义分析服务器,提高多用户环境下的服务能力。
- REST交换的基本方法是客户端和服务器之间的交互在请求之间是无状态的。
- 从客户端到服务器的每个请求都必须包含理解请求所必需的信息。如果服务器在请求之间的任何时间点重启,客户端不会得到通知。
- 此外,无状态请求可以由任何可用服务器回答,这十分适合云计算之类的环境。客户端可以缓存数据以改进性能。