热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

asp过滤关键词(过滤关键词网站)

今天,我们带来了一个可以保护个人隐私的网络搜索服务——秘迹搜索。秘迹搜索不会记录用户输入的查询关键词,真正做到搜索不留痕,彻底摆脱定向广告的骚扰。谈到保护隐私,先来看看其他的网络搜


今天,我们带来了可以保护隐私的互联网搜索服务——秘密跟踪搜索。 秘密搜索不记录用户输入的搜索关键字,不在搜索中留下痕迹,完全摆脱定向广告的骚扰。


关于隐私保护,让我们看看其他互联网搜索引擎是如何获取用户隐私信息的。 目前,在中国大陆提供搜索服务的搜索引擎(以及海外谷歌)通过同样的方法获取用户隐私,因此以下用某搜索统一替换所有其他跟踪用户的搜索引擎。


日常用户使用某搜索引擎的过程可以分为以下几个步骤来理解。


使用浏览器打开某个搜索网站的网址,输入查询关键字。


某搜索网站在返回搜索结果数据的同时,为了尽可能准确地跟踪用户在互联网上的各种行为,如跟踪脚本、跟踪图片、跟踪网络跟踪器等


今后,当这个用户查询到不同的关键词时,某搜索网站将利用跟踪技术,不断收集和保存他的搜索和行为信息浏览。 它丰富地描绘了这个用户的兴趣、健康状况,甚至家庭成员等的隐私信息。




这些搜索引擎在收集了大量的用户图像信息后,最主要的商业变现方式是定向广告。 下图是在某搜索引擎的广告平台上宣传了精准人群的定向能力,每天平均百亿次的在线行为数据很可能包括你的搜索和点击行为。




当一个用户使用秘密跟踪进行搜索时,使用: 1.浏览器打开https://mijisou.com,输入查询关键字。 2 .启动的网络请求将被传递给秘密跟踪搜索的服务。 但是,秘密搜索的服务器中没有记录任何用户的信息(不仅没有记录用户输入的搜索词,也没有记录任何从用户浏览器带来的IP地址、用户代理、HTTP Header等信息)。 3 .最后,秘密跟踪搜索将结果数据返回给用户的浏览器。 秘密搜索没有存储任何用户信息,也没有使用跟踪用户的黑色技术(跟踪脚本,跟踪像素,跟踪标签),甚至使用了浏览器的COOKIE




在讨论了其他搜索和秘迹搜索的区别之后,让我们来看看许多网民常见的疑问之一。 许多浏览器都具有隐藏或隐藏模式。 在隐藏模式下使用某搜索是否会泄露用户隐私信息? 其实这个答案是写在隐藏(无痕迹)模式的提示里的。 请参照下图。 浏览器的隐藏模式只是不会在你的电脑上留下浏览记录和记录,但并不妨碍你访问的网站收集你的个人信息。 也就是说,只有秘迹检索才是真正没有痕迹的检索。




上述对比分析表明,对于用户隐私保护,秘密搜索并不是什么不可思议的黑技术,而是严格遵循不存储和记录与用户身份相关的信息的隐私原则。 这里重点介绍秘迹检索为严格执行上述隐私原则在技术实现上所做的实践和尝试。


没有饼干的搜索引擎


说到COOKIE,对技术很了解的朋友可能不知道。 简单地说,COOKIE是指网站为了记录用户的状态信息而保存在用户浏览器中的数据文件。 虽然COOKIE的发明被用于优化互联网服务的体验,但是现在用于跟踪用户身份的网站越来越多。 关于秘密搜索服务,如上所述,没有在用户的浏览器中植入COOKIE。 打开浏览器的开发者工具就知道这一点。 请参照下图。



/p>

从上面的对比分析中,我们可以清楚地看到对于用户的隐私保护,秘迹搜索并没有用太过神奇的黑科技,只是在严格遵循一条隐私原则:不存储和记录任何可以关联到用户身份的信息。下面我们会重点介绍一下为了严格执行上述隐私原则,秘迹搜索在技术实现上所做的实践和尝试。

没有COOKIE的搜索引擎

说起COOKIE, 可能对于熟悉技术的朋友都不会陌生。简单的说,COOKIE就是:网站为了记录用户的状态信息而在用户的浏览器里保存的数据文件。COOKIE的发明本是用来优化互联网服务体验的,但是现在越来越多的网站将它用来进行用户身份追踪。对于秘迹搜索服务,如上文所述,我们没有在用户的浏览器里种任何COOKIE。这一点只要你打开浏览器的开发者工具就可以看到,见下图。

提供匿名访问功能

除了提供搜索服务外,秘迹搜索对于检索到的结果还提供匿名访问功能,见下图所示。

匿名访问功能本质上是一个代理服务,比如你想访问秘迹搜索结果页中的 www.a.com 网站,如果通过匿名访问来浏览, 我们会通过代理服务(proxy.mijisou.com,这个代理服务是秘迹搜索自己的独立服务,依然不会记录任何请求日志)去获得www.a.com网站上的有用信息,然后再把有用信息中转展示给用户。 这个代理服务会完全保护用户免受各种追踪和搜扰。 但是在目前阶段我们的匿名访问的兼容性还需要完善。对于部分网站,有时候还会出现乱码和服务请求超时等问题。我们的程序员小哥哥正在不断优化这些服务,如果在使用过程中碰到这些问题,敬请谅解或者反馈给我们。

如果不收集用户数据,那我们是如何统计搜索访问量的呢?

每个网站都会统计用户访问量,为了准确的统计出每日用户请求数,在不收集任何用户信息的前提下,我们在search.conf 配置文件中增加了如下命令语句: access_log /var/log/nginx/search_access.log searchformat if=$arg_q (秘迹搜索的请求参数是q, 所以才使用$arg_q这个变量), 用白话翻译就是说只有用户真正使用秘迹搜索发起一次搜索请求时,我们才会根据searchformat 这个日志格式来记录日志。searchformat 的格式 : log_format searchformat '$status $time_local $http_host site="$server_name"(在Nginx.conf文件中配置) ,每条用户请求的真实日志如下所示。

200 23/Oct/2018:21:36:58 +0800 mijisou.com

可以看到秘迹搜索没有记录任何有关用户个人信息的字段, 我们使用上述方法做到了不记录任何用户请求信息的同时,又可以准确统计出秘迹搜索的每日访问量。未来我们也希望可以实时公开搜索服务的日志,甚至能够做到将整个运维操作实时公开,这些后续目标在我们的todo list 中,敬请期待。

互联网和大数据技术带来便捷生活体验的同时,也带来了种种乱象: 精准的用户画像被用来做大数据杀熟、网络上的定向广告比单元楼里粘贴的小广告还要可恶,网民的个人信息在黑市上、在各种互联网广告公司手上交易、贩卖。面对这样的现实,我们希望能够尽一点微薄之力,能够守护一丝网民的隐私信息。如果你也有这样的想法,快来联系我们吧。

PS: 为了保证我们服务的公开透明,目前我们特意选用了一个开源的j解决方案,而且我们基于其上的改进也同步开源出来。这样任何组织或者个人,都可以部署一套这个服务,给你自己或者你的家人、朋友使用。只要你部署的这个服务有足够多人使用,就可以确保自己的搜索关键字无法被跟踪。当然,你的部署如果只有你自己一个人用,就没有意义了。可以说,越多人用的话,搜索行为数据就被保护的越好。道理很简单,大隐隐于市。


推荐阅读
  • Cookie学习小结
    Cookie学习小结 ... [详细]
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 在软件开发过程中,经常需要将多个项目或模块进行集成和调试,尤其是当项目依赖于第三方开源库(如Cordova、CocoaPods)时。本文介绍了如何在Xcode中高效地进行多项目联合调试,分享了一些实用的技巧和最佳实践,帮助开发者解决常见的调试难题,提高开发效率。 ... [详细]
  • 服务器部署中的安全策略实践与优化
    服务器部署中的安全策略实践与优化 ... [详细]
  • 本文探讨了利用Python编程语言开发自动化脚本来实现文件的全量和增量备份方法。通过详细分析不同备份策略的特点,文章介绍了如何使用Python标准库中的os和shutil模块来高效地管理和执行备份任务。此外,还提供了示例代码和最佳实践,帮助读者快速掌握自动化备份技术,确保数据的安全性和完整性。 ... [详细]
  • 阿里云服务器搭建详解——Ubuntu
    由于自己电脑配置跟不上,双系统一开,整个电脑就会变得非常卡顿,所以决定在阿里云买一个云服务器。听朋友说,学生买的话是非常便宜 ... [详细]
  • 本文详细介绍了 HTML 中 a 标签的 href 属性的多种用法,包括实现超链接、锚点以及调用 JavaScript 方法。通过具体的示例和解释,帮助开发者更好地理解和应用这些技术。 ... [详细]
  • EST:西湖大学鞠峰组污水厂病原菌与土著反硝化细菌是多重抗生素耐药基因的活跃表达者...
    点击蓝字关注我们编译:祝新宇校稿:鞠峰、袁凌论文ID原名:PathogenicandIndigenousDenitrifyingBacte ... [详细]
  • 解决Only fullscreen opaque activities can request orientation错误的方法
    本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误,并提供了一种有效的解决方案。 ... [详细]
  • 本文详细介绍了 InfluxDB、collectd 和 Grafana 的安装与配置流程。首先,按照启动顺序依次安装并配置 InfluxDB、collectd 和 Grafana。InfluxDB 作为时序数据库,用于存储时间序列数据;collectd 负责数据的采集与传输;Grafana 则用于数据的可视化展示。文中提供了 collectd 的官方文档链接,便于用户参考和进一步了解其配置选项。通过本指南,读者可以轻松搭建一个高效的数据监控系统。 ... [详细]
  • 在尝试对 QQmlPropertyMap 类进行测试驱动开发时,发现其派生类中无法正常调用槽函数或 Q_INVOKABLE 方法。这可能是由于 QQmlPropertyMap 的内部实现机制导致的,需要进一步研究以找到解决方案。 ... [详细]
  • PTArchiver工作原理详解与应用分析
    PTArchiver工作原理及其应用分析本文详细解析了PTArchiver的工作机制,探讨了其在数据归档和管理中的应用。PTArchiver通过高效的压缩算法和灵活的存储策略,实现了对大规模数据的高效管理和长期保存。文章还介绍了其在企业级数据备份、历史数据迁移等场景中的实际应用案例,为用户提供了实用的操作建议和技术支持。 ... [详细]
  • 本文详细介绍了在CentOS 6.5 64位系统上使用阿里云ECS服务器搭建LAMP环境的具体步骤。首先,通过PuTTY工具实现远程连接至服务器。接着,检查当前系统的磁盘空间使用情况,确保有足够的空间进行后续操作,可使用 `df` 命令进行查看。此外,文章还涵盖了安装和配置Apache、MySQL和PHP的相关步骤,以及常见问题的解决方法,帮助用户顺利完成LAMP环境的搭建。 ... [详细]
  • 解决针织难题:R语言编程技巧与常见错误分析 ... [详细]
  • 如何在Oracle ASM_Diskgroup中重命名现有磁盘
    如何在Oracle ASM_Diskgroup中重命名现有磁盘 ... [详细]
author-avatar
看具戴_370
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有