TOR 的原理（2）————Tor 的运行

话说上次咱们聊了聊到底什么才是匿名以及匿名系统需要做到什么，这回就一起来看看这个可爱的洋葱头究竟是怎样保护我们的吧！TOR 是 TheOnionRouter 的缩写，直译就是洋葱路由。那为什么会叫 “洋葱路由” 呢？
TOR 官网上简单介绍了 TOR 的原理：TOR 是一个三重代理，TOR 客户端先与目录服务器通信获得全球活动中继节点信息，然后再随机选择三个节点组成 circuit（电路），用户流量跳跃这三个节点（hop）之后最终到达目标网站服务器，每隔 10 分钟左右就会再重新选择三个节点以规避流量分析和蜜罐节点。
看到这里，有些人就会开始这么说了：看起来除了每隔 10 分钟左右变换节点之外，其他与任意三个代理组成的三重代理也没什么区别啊。
真的是这样的吗？
TOR 的具体工作机制可远远没有官网上介绍的简单：当用户启动 TOR 后，TOR 客户端就会在本机 PC 上运行一个 onionproxy，同时开始监听本机的 9150 端口（TorBrowser 里的 Tor 监听端口），所有经过这一端口的流量都会在经过 onionproxy 的处理之后进入 TOR 电路中。关于端口有必要做一下说明：对于服务器，只要服务器开机，端口就一直存在；但对于本机，只有相应的应用程序试图与远程服务器通过特定端口通信时，端口才会出现，一旦通信结束端口就会立即消失。也就是说，这个 9150 端口只有在某一应用程序（例如被设置过的浏览器，例如 Tor）试图通过它与远程主机通信时才会出现，并不是个物理存在。
不过这会儿还不能传输用户数据呢，在本机上运行 onionproxy 只是第一步而已，然后当然是与存有全球中继节点信息的目录服务器取得联系了。一开始这一步是明文 HTTP 通信，有着增加流量指纹的风险，后来 Tor 开发者进行了改进，让 Tor 客户端第一步先与入口节点通信（当然第一次连接是做不到的，以后的连接都可以这么做了）再与目录服务器通信更新节点信息，全过程都是 TLS「4」的，这样做不仅保证了安全，还避免了单独与目录服务器建立一次性的 TLS 连接，提高了效率（因为建立 TLS 连接是很消耗资源的，生成随机参数进行密钥交换强加密传输数据都是要进行大量运算的，如果只是为了短暂的一次性连接，那么就有些太浪费了）：当完成更新中继节点信息之后，客户端不必切断连接，而是可以直接把原来的 TLS 连接「拔出来」再继续组成电路（意思是原来的 TLS 连接的参数还可以继续使用，而不用又重新计算生成）「3」得到中继节点信息之后，电路构造过程就正式开始了！
对了，诸位猜一下，Tor 电路会是怎样的呢？会怎样进行构造呢？
“既然是个三重代理……要么是这样一个过程：onionproxy 先将数据加密传送到入口节点，然后入口节点又加密传送到中间节点，中间节点又加密传输到出口节点，在 HTTP 的情况下这三个节点都能看到明文（一般的代理就是这样的）？” 我说，你不觉得这样非常不安全吗？要是其中有哪一个节点被攻破或者是蜜罐，那么你可就呵呵了！还有就是如果不进行特别设置的话，后面两个代理也是知道用户数据流的真实来源的（真实 IP），也就是说安全性还是相当于一重代理！那么，Tor 究竟是怎么做的呢？
“哪个节点都不可信，像洋葱一样” 这就是 Tor 环路的核心思想所在：和普通的 TCP 流不同（Tor 工作在 TCP 流之上），Tor 协议把通信数据打包为了一个个特殊的 cell：一开始建立 Tor 电路时，本机上的 onionproxy 向入口节点发送 createcell 进行 TLShandshake，这一过程的身份认证过程是基于数字证书的：Tor 有着自己的一套数字证书系统，每一个洋葱路由（就是节点）都有一个用于签发证书的身份密钥和用于解密用户的电路建立请求以及协商出一个用于后续通信的（使用时间）短暂的密钥。当节点之间进行通信时，这个特制的 TLS 协议还会建立短期连接密钥，而且这一密钥会周期性的独立发生变化以最大限度降低密钥泄露带来的风险
那么接下来又会发生什么呢？Tor 电路默认由客户端和三个节点组成，那么我们就来看看在这种情况下 Tor 电路究竟是怎样建立的吧：
首先是客户端（onionproxy）发送 createcell 与入口节点完成 handshake，然后客户端向入口节点发送 TLS 加密数据 relaycell……“里面是用户数据吧！发送到入口节点之后，入口节点就进行解密，然后再重新打包并与中间节点建立连接……” 当然不是了！这样的话，入口节点什么都知道了，哪里还有安全性呢？Tor 是这么做的：客户端最先发过去的 relaycell1 是入口节点与中间节点建立 TLS 连接时所需要的参数，接着发过去的 relaycell2 是中间节点与出口节点建立 TLS 连接时所需要的参数，接下来是只有目标网站和对应端口信息的 relaycell3，在返回表明已成功建立环路的 relaycell4 之后才会真正开始发送包含用户信息的 relaycell5. 这一过程中 relaycell1 被一重加密，到了入口节点之后就被解密，再用来与中间节点完成握手；relaycell2 被两重加密，到了入口节点时第一重加密解除，到了中间节点时第二重加密解除，中间节点可以看到明文，用来与出口节点完成握手；relaycell3 被三重加密，只有出口节点能看到明文，被用来与目标网站建立连接。同样 relaycell5 也是三重加密的，只有出口节点能看到明文（HTTP）。
「就像洋葱一样」，对，用户数据就像洋葱一样，被层层包裹着，只有到了终点包裹才会解开。在这一过程中，只有入口节点知道用户的真实 IP 地址，出口节点知道用户的目的地和传输内容（HTTP），Tor 电路的 cell 里没有其他任何关于用户真实身份的信息（这里不考虑 cookie 和 flash 插件等应用层协议和程序带来的隐私问题（这些也不是 Tor 本身能够左右的，Tor 使用的是在传输层之上应用层之下的 SOCKS 代理，无法操纵修改上层协议，但这也使得 Tor 能成为很多软件的代理，不被应用层协议们所左右），只针对于传输过程而言）「似乎有哪里不对呢：如果说这几重加密都是预设的参数，那么一是做不到完全随机了（一定要人为去划分入口节点中间节点出口节点才能做到事先内置相应的解密密钥），二是一旦密钥泄露后果就会相当严重的。但如果不是预设参数而是每次连接时都随机协商，那么又该怎么做呢？」「你说得没错，Tor 电路中的节点们并没有预设参数，而是采取了「半握手」的方法：在 diffie-hellman 算法的帮助之下，onionproxy 和中间节点通过入口节点的中介交换了参数，然后就能各自算出私钥用于后续通信而不用担心有人监听，入口节点虽然知道这两个参数，但也根本没办法算出私钥来，这是 diffie-hellman 算法设计时所保证的」。同理也可以与出口节点安全通信，客户端最里面一层的加密只有出口节点能够解开，入口节点和中间节点都看不到只有出口节点才能看到的内容。
那么，Tor 在建立电路时又是怎么选择节点的呢？
借助算法随机选择，没错，但 “一次性随机选择三个节点”，错了！
Tor 客户端先随机选择一个入口节点，然后入口节点再随机选择一个中间节点，中间节点又随机选择一个出口节点，这样来最大限度实现随机建立电路。而且 Tor 还有一个更特别的地方：很多用户的流量可以被整合到一个 TLS 连接里同时传输！看起来就像一个用户一样！「3」这样一来，匿名程度更高了，但很多时候又会带来一件麻烦事：很多用户的来自同一个 IP 的大量流量都同时指向同一个网站（例如 google），看上去非常像是 DoS（拒绝服务）攻击，此时就会触发网站的防御机制，网站会要求用户输入验证码，非常烦人。
“可爱的洋葱头很努力啊。” 现在谁还会说 Tor 只是一个三重代理呢？

访问数: 57

打赏赞

网友发表在如何在统信系统 (UOS) 和麒麟系统上安装 chromium2025 年 1 月 23 日
怪不得我安装不起高版本
匿名发表在如何在统信系统 (UOS) 和麒麟系统上安装 chromium2025 年 1 月 23 日
主要是高版本 chromium 不支持 h26…
星海发表在让闲置服务器散发第二春，搭建 google, 维基百科镜像站2024 年 9 月 4 日
特来感谢博主的关键提醒：本人前边按这个办…
磁选发表在经验交流材料：打好 “四位一体” 组合拳推进基层党建 “四提升”2024 年 8 月 2 日
真是受益匪浅的一篇文章！作者深入浅出地解…
磁选机发表在在基层党校高质量发展工作推进会上的讲话提纲2024 年 8 月 2 日
感谢作者的精彩分享，让我对 XX 领域有了更…

TOR 的原理（2）————Tor 的运行

发表回复取消回复

您错过了

银河麒麟操作系统账户被锁定与忘记密码的解决办法

领导干部任职表态发言

推荐几个命理推算的 deepseek 等 AI 使用的提示词

DeepSeek 等 AI 写材料提示词速成手册

相关文章

发表回复 取消回复

您错过了

发表回复取消回复