成果详情
网络敏感信息搜索系统

成果详情

研发背景
随着互联网的迅速发展,网络信息数量快速膨胀,人们迫切希望能在海量资源中准确找出对自己有价值的信息。例如对于政府机构来说,关心的可能是网络上面对某个事件的舆论动态;对于一般企业来讲比较关心自己产品的前途及用户的评价,他们希望能从网上获取较多的反馈信息;对于军工企业,最关心的就是自己研制的产品信息不能被泄密,所以他们经常会需要网上搜索,以发现他们产品泄密信息状况。

应用范围
对于行政机关,民众通过网络发言,形成公共舆论,监管政府行为,可以改进政府的工作。

技术路线及原理
技术指标:

1.搜索具备近义词自动替换功能;

2. 具备信息源头追溯功能;

3.信息检索准确率和召回率都达到90%以上;

4. 用户能够自定义和更改敏感站点信息数据库;

5. 系统根据用户需求提供企业常用敏感信息库;

6. 24小时完成对指定中文站点的常规搜索,分析和预警;

7. 按照危害评估结果和网页信息的敏感度,采用不同级别的报警措施。

技术特色
本系统提供元搜素引擎和多线程网络爬虫,对用户预先定义的敏感信息在互联网上的中英文网站进行实时搜索。对存在敏感工作信息的网页和常用格式文件进行关键字、摘要、发布日期等信息的自动提取,并有效存储在本地数据库中,根据敏感度实行分级别的预警。

经济效益分析
随着互联网的迅猛发展, 信息充斥着各种类新闻、军事、财经、求职等网站,庞大的网络信息资源中常常夹杂着行政机关和企业不希望与其他人共享信息:对于行政机关,民众通过网络发言,形成公共舆论,监管政府行为,可以改进政府的工作。另一方面,网络舆论一旦被错误地控制和引导,将成为影响社会稳定的重大隐患。;对于企业来讲,第一时间获取关于公司的正负面新闻、泄密信息、公司领导的相关报道、近期的舆论热点等,以及深层次调研用户需求,改进自身的售后服务、借鉴竞争对手的核心竞争力情况等。这些对于企业提升自身竞争力都至关重要。