本文共 1811 字,大约阅读时间需要 6 分钟。
在有关文章中,我解释了如何安装和开始使用对等搜索引擎。 但是,YaCy最令人兴奋的事情之一就是它是本地客户。 每个用户在全球分布的搜索引擎基础结构中拥有并操作一个节点,这意味着每个用户都可以完全控制他们如何导航和体验万维网。
例如,Google曾经提供URL google.com/linux作为过滤与Linux相关主题的搜索的快捷方式。 这是一个很小的功能,许多人发现它有用,但是在2011年了 。
YaCy使自定义搜索体验成为可能。
安装YaCy后,导航至localhost:8090的搜索页面。 要自定义搜索引擎,请单击右上角的“ 管理”按钮(它可能隐藏在小屏幕上的菜单图标中)。
管理面板允许您配置YaCy如何使用系统资源以及它如何与其他YaCy客户端交互。
例如,要配置备用端口并设置RAM和磁盘使用率,请使用侧栏中的“ 第一步”菜单。 要监视YaCy活动,请使用“ 监视”面板。 单击面板可发现大多数功能,但这是我的最爱。
YaCy默认情况下主张隔离和隐私。 您可以在“ 网络配置”面板中调整连接到对等网络的方式,方法是单击“ 用例和帐户”配置屏幕顶部的链接,以显示该对等网络。
对等索引是用户驱动的。 在互联网上每个可访问的页面上都没有大型公司发起搜索,因此,除非有人故意使用YaCy对其进行爬网,否则不会对网站建立索引。
YaCy客户端提供了两个选项来帮助您帮助爬网:可以执行手动爬网,并使YaCy可用于建议的爬网。
手动爬网是在您输入要索引的站点的URL并启动YaCy爬网作业时。 为此,请单击“ 生产”边栏中的“ 高级搜寻器”链接。 输入一个或多个URL,然后滚动到页面底部并启用“ 执行远程索引”选项。 这使您的客户端可以广播正在索引的URL,因此选择接受请求的客户端可以帮助您执行爬网。
要开始爬网,请单击页面底部的开始新的爬网作业按钮。 我使用这种方法来索引我经常使用或发现有用的网站。
抓取作业开始后,YaCy会对您输入的URL进行索引,并将索引存储在本地计算机上。 只要您在高级模式下运行(意味着您的防火墙允许端口8090上的传入和传出流量),您的索引就可以供全球YaCy用户使用。
尽管一些非常敬业的YaCy高级用户可能会强迫性地爬网,但世界上仍有很多站点。 似乎无法匹配流行的蜘蛛和僵尸程序的资源,但是由于YaCy具有如此多的用户,因此他们可以作为一个社区团结起来,以索引互联网,而不是任何一个用户独自完成。 如果激活YaCy以广播网站爬网的请求,则参与的客户端可以一起爬网您可能不会手动爬网的站点。
要将客户端配置为接受来自其他客户端的作业,请单击左侧边栏菜单中的“ 高级搜寻器”链接。 在“ 高级 搜寻器”面板中,单击页面顶部“ 网络收集”标题下的“ 远程搜寻”链接。 通过在“ 加载”设置旁边的复选框中打勾,启用远程爬网。
YaCy是一个非常强大的搜索引擎,几乎为您提供了机会,让您有机会主题化和完善您的体验。 您可以在“ 监视”面板中监视 YaCy客户端的活动,这样您可以了解有多少人从YaCy社区的工作中受益,还可以了解YaCy客户端为计算机和网络产生的活动。
您在“管理”屏幕上花费的时间越长,思考您使用搜索引擎如何改变视角的乐趣就越大。 即使是最简单的查询,您获得的结果也会影响您的互联网体验。 实际上,当您与不同行业的计算机用户交谈时,您可能会注意到一个人的“互联网”与另一个人的互联网有何不同。 对于某些人来说,网络上充斥着广告和促销搜索,并且遭受了对查询的了解响应的隧道愿景。 例如,如果某人不断搜索有关X的答案,则大多数商业搜索引擎都会重视与X有关的查询响应。一方面,这是一个有用的功能,但它会遮盖需要Y的答案,即使这样做可能更好。解决特定任务的方法。
就像在现实生活中一样,走出虚构的世界视野可以带来健康和启发。 尝试YaCy,然后看看您发现了什么。
翻译自:
转载地址:http://woczd.baihongyu.com/