幻域

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 36|回复: 0

搜索引擎的妙用,告别小白

[复制链接]

6696

主题

124

回帖

1万

积分

羽化登仙

是非在己,毁誉由人,得失不论

Rank: 9Rank: 9Rank: 9

UID
1
源力
-4346
灵气
5584
在线时间
375 小时
注册时间
2023-9-16

论坛模范灌水大师在线之王将心比心金点子声明远扬活跃大师管理必备发声者元旦徽章千天纪念

发表于 2024-9-16 18:36:07 | 显示全部楼层 |阅读模式

尽快登录注册

您需要 登录 才可以下载或查看,没有账号?立即注册

x
新手阅读理解
搜索引擎原理(Principle of Search Engine),搜索引擎,通常指的是收集了万维网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。再经过复杂的算法进行排序(或者包含商业化的竞价排名、商业推广或者广告)后,这些结果将按照与搜索关键词的相关度高低(或与相关度毫无关系),依次排列。
它的整个工作过程大体分为信息采集、信息分析、信息查询和用户接口四部分。
信息采集是网络机器人扫描一定IP地址范围内的网站,通过链接遍历Web空间,来进行采集网页资料,为保证采集的资料最新,网络机器人还会回访已抓取过的网页;
信息分析是通过分析程序,从采集的信息中提取索引项,用索引项表示文档并生成文档库的索引表,从而建立索引数据库;
信息查询是指用户以关键词查找信息时,搜索引擎会根据用户的查询条件在索引库中快速检索文档,然后对检出的文档与查询条件的相关度进行评价,
最后根据相关度对检索结果进行排序并输出
知识点
信息采集,分析,查询,接口四个部分
问我们当在google随意输入一个查询的内容的时候,其实只是返回一个内容相关性在数据库的返回,通过模糊搜索的方法很难高效的找到我们要的结果,所以我们要进行对用户搜索接口进行学习和了解
常见的搜索引擎入口,看了原理所以你懂了,每家的搜索引擎基本就是一个巨大的索引数据库,每家爬虫爬取和存储的内容都不一样,所以多用不同的搜索引擎入口也能带来不同的效果
国内
百度一下,你就知道
24
[tr==#E3EDF5]360搜索,SO靠谱 45
[tr===#E3EDF5]搜搜更懂你 37
[tr====#E3EDF5]搜狗搜索引擎 - 上网从搜狗开始 14
[tr=====#E3EDF5]网易有道 28
[tr======#E3EDF5]Bing 7
[tr=======#E3EDF5]搜狗微信搜索_订阅号及文章内容独家收录,一搜即达 42
国外
[tr========#E3EDF5]Yahoo Search - Web Search 43
[tr=========#E3EDF5]Google 11
[tr==========#E3EDF5]DuckDuckGo — Privacy, simplified. 39
[tr===========#E3EDF5]Ask.com - What's Your Question? 28
http://www.search.aol.com 11
http://www.wolframalpha.com 13
http://www.yandex.com 14
http://www.webcrawler.com 13
搜索引擎的高级用法语法学习[每家的搜索语法都大差不差,自行搜索解决语法问题]
  1. 1. 完全匹配搜索
  2. 查询词外加上 双引号" " 不会被拆开成词分别搜索

  3. 2. 标题含有关键词,网页标题搜索
  4. intitle:参数, 如intitle: pornhub

  5. 3. 指定文档格式
  6. 加上filetype: 参数, 如filetype: pdf则可以指定过滤结果为pdf

  7. 4. 去除不想要的结果
  8. sbsbsb -百度文库

  9. 5. 运算 OR AND |
  10. 图片|视频就会返回"图片"的搜索结果和"视频"的搜索结果

  11. 6. *通配符
  12. *擎 就可以搜索出搜索引擎

  13. 7. 括号运算,多命令
  14. (site:pornhub.com And aa)

  15. 8 define 查词汇的定义
  16. define: anime

  17. 9. Cache 缓存快照
  18. Cache:sina.com

  19. 10. related: 类似网站
  20. related: coursera.com

  21. 13. allintitle: 网页标题包含以下所有关键词
  22. allintitle:诸葛亮 王司徒(冒号后面不能有空格)

  23. 14. inurl: 网址中包含特定的词
  24. inurl:iphone(冒号后面不能有空格)

  25. 15. allinurl: 网址中包含以下所有词
  26. allinurl:apple iphone

  27. 16. intext: 只找网页里的文字(不搜索标题、网址等其他部分)
  28. intext:apple iphone(冒号后面不能有空格)

  29. 17. allintext: 只找网页里的文字,包含以下所有关键词
  30. allintext:apple iphone

  31. 18. AROUND(X):两个词距离在X之内
  32. apple AROUND(4) iphone(搜到的是apple和iphone两个词距离不超过4的结果)
复制代码

如何检索想要的内容
实战下如何快速获取信息
来源V1佬突然有一天问了我怎么快速获取空投的订阅信息,那我就举个例子进行实践
首先翻译下空投【Airdrop】这个单词,然后我要的是汇总订阅信息,那么我先进行全局搜索,看下一般空投项目都是在哪里发布,然后发现Twitter.com上有很多发空投项目的信息,最后去Twitter上找到一些telegram的频道,那么我可以确定基本就是,Twitter + Airdrop + telegram的网站
通过上面的分析和总结,那么我们打开 https://duckduckgo.com/ 74 输入学习到的语法
站点限定为Twitter.com 7 关键字为Airdrop,限定内容为 https://t.me 7 那么下面的搜索语法就产生了

site:"twitter.com" Airdrop "https://t.me"
BBS,海外,地下论坛,带TXT内容,带Crack
世界上一共有三个Cthulhu,你,我,他
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

QQ|Archiver|手机版|小黑屋|幻域 |网站地图

GMT+8, 2025-5-15 17:35 , Processed in 0.076050 second(s), 30 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表