文件传输系列:SCP

SCP 就是 SSH 协议的文件传输功能吗?

SCP(Secure Copy Protocol,安全复制协议)允许我们在两台计算机之间复制文件(和目录)。

使用起来特别方便:

Shell

$ scp local_file remote_host:/home

这将把本地文件 localfile 复制到远程主机的 /home 文件之下。

SCP 使用起来特别便利,因为他能工作在几乎所有的 Unix-like 的系统中,并且 Windows 下拥有许多客户端。但是仅仅复制文件并不是关键。SCP 真正的价值是对 计算机的身份进行验证 以及对 传输文件进行加密(也就是 S 代表的含义)。

使用前需要首先配置到远程主机的 SSH 连接权限。SCP 的验证提示和 SSH 看起很像,因为 SCP 跑在 SSH 的上层,仅仅把它作为文件数据的管道。事实上,SSH 负责处理所有安全相关的任务,SCP 只是将一些文件扔到 SSH 连接上。

维基百科上的条目讲述了 SCP 的历史,简而言之:在旧的 BSD 系统上曾经有一个叫 RCP 的工具,可以在电脑之间移动文件。在当时受信任的网络时代,每个人都是别人的朋友。后来人们意识到,也许并不是每个人在他们的网络上都是这么好的朋友。于是有人把 RCP 的实现复制到 OpenSSH 的前身上,然后简单地在 SSH 会话上运行它,以保护文件不被非好友发现。问题解决了!从此以后,它就留在了 OpenSSH 中。

SCP 并不是一个标准协议,并没有一个 RFC 或者任何官方描述如何实现它。OpenSSH 实现是一个事实上的规范。此实现有两个部分:连接建立和之后的传输协议。

实际上,这并不是真正的连接。因为它只是利用 SSH 执行命令后的 STDIN/STDOUT ,有点类似 Unix 管道。OpenSSH 中包含两个程序来完成:sshdscpsshd 是始终运行的服务器守护进程,接受新的 SSH 连接。SCP 是伪装成 SSH 的客户端程序,发送和接受文件。

SCP 运行时,他将开启一个新的 SSH 连接。在该连接上,它会在服务端执行另一个带有特殊标志的 SCP 程序。你可以认为是 ssh exec scp [flags]。主要的标志包含 -t(“to”)和 -f(“from”)用于代表接受和发送,而 -d 表示文件夹,-r 表示递归。

建立连接

值得注意的是,SCP 协议是单向的,一端发送文件,另一端接收文件。在远程端 SCP 开始运行后,实际的 SCP 协议命令开始通过 STDINSTDOUT 运行。

现在,安全的 I/O 通道建立起来,并且已经有效地切换到 RCP 协议上。该协议是 顺序(一次一个操作)和 同步(每个命令执行完后才执行下一个命令)执行的。

命令格式大致为(不带括号或空格):[command type][arguments]\n [optional data]

  • [command type] 通常是一个 ASCII 字符:

    • ‘C’- 写入文件
    • ‘D’- 输入目录
    • ‘E’- 退出最后一个目录
    • ‘T’- 设置下一个文件或目录的创建 / 更新时间戳
  • [arguments] 是特定于命令的,如文件 / 目录名称、文件大小或时间戳。“E” 命令没有参数。

  • [optional data] 在上一个命令为 “C”(创建文件)时发送。数据的大小指定为 “C” 的参数。

此外,还有控制字节,这些字节是在没有新行的情况下自己发送的:

  • ‘0x00’-“OK”,确认完成最后一个命令(如编写本地文件)。接收方也会在启动时发送此消息,让发送方知道它已准备好接收命令。

  • ‘0x00’-“警告”,后面是要向用户显示的行(由新行终止)。

  • ‘0x00’-“错误” 后跟随可选消息(和警告相同),但连接随后终止。

下面这个带有注释的图片实例,详细讲述了这个过程:

传输过程

shell

$ scp 选项 参数

其中选项如下:

shell

-1:使用ssh协议版本1;
-2:使用ssh协议版本2;
-4:使用ipv4;
-6:使用ipv6;
-B:以批处理模式运行;
-C:使用压缩;
-F:指定ssh配置文件;
-l:指定宽带限制;
-o:指定使用的ssh选项;
-P:指定远程主机的端口号;
-p:保留文件的最后修改时间,最后访问时间和权限模式;
-q:不显示复制进度;
-r:以递归方式复制。

参数分别为:

  • 源文件:指定要复制的源文件。
  • 目标文件:格式为 user@host:filename(文件名为目标文件的名称)。

看起来,SCP 听起来似乎没什么问题。它是一个简单易用的工具,然而存在一些现实问题。

传输协议的顺序性:每个命令的强制确认都会增加大量开销。例如,如果沿途丢弃单个确认数据包,则整个连接将暂停,直到重新传输开始。最重要的是,发送所有数据而不压缩或询问接收方是否已经拥有该文件并不理想。

有经验的系统管理员可以告诉您,使用 tar 归档文件并发送比使用 scp 递归命令传输要快得多。事实上,这样的话你甚至无需使用 SCP:

Shell

# Copy a local folder with 10000 files
$ find /tmp/big_folder/-type f | wc -l
10000

# Using scp
$ time scp -r -q /tmp/big_folder/server:/tmp/big_folder

________________________________________________________
Executed in  882.99 millis	fish       	external
   usr time  114.09 millis	0.00 micros  114.09 millis
   sys time  278.46 millis  949.00 micros  277.51 millis

# Using tar over ssh
$ time sh -c "tar cf - /tmp/big_folder | ssh server 'tar xC /tmp/-f -'"
tar: Removing leading '/' from member names

________________________________________________________
Executed in  215.68 millis	fish       	external
   usr time   93.22 millis	0.00 micros   93.22 millis
   sys time   66.51 millis  897.00 micros   65.62 millis

在这种比较糟糕的情况下,tar&ssh 的 215.68ms 对比 SCP 的 882.99ms,足足有四倍的速度提升。

我们已经知道,SCPSSH 负担安全工作,因此它完全安全… 吗?

OpenSSH 的发行说明提到:

scp 协议已经过时、不灵活且不容易修复。我们建议使用更现代的协议,如 sftp 和 rsync 来传输文件。

如果远程端的 shell 打印出任何非交互式会话,则本地 SCP 进程将愉快地将该输出解释为 SCP 命令。好的话,这仅仅是打破 SCP 协议中模糊的错误。但在最坏的情况下,远程 shell 启动脚本是恶意的,并向你发送恶意文件,而不是所需的文件。

此外,早在 2018 年,Harry Sintonen 就发现了流行的 SCP 实现(包括 OpenSSH)中的一堆漏洞。包括从修改目录的权限到覆盖任意文件(由于 ~/.ssh/authorized_keys~/.bashrc)、有效地执行代码,以及注入终端转义序列来隐藏任何追踪。这些漏洞对于任何构建网络 CLI 应用程序的人来说都是一个很好的教训。

SFTP 被广泛认为是 SCP 的继承者。为了传输层安全性,它仍然在 SSH 上运行,并且不需要单独设置访问。它可以为您提供一个自定义交互式提示来探索远程文件系统,或者您可以使用预先编写的一系列命令编写脚本。 缺点是,您需要学习 SFTP 提示命令,协议本身尚未完全标准化(有很多 RFC 草稿,但作者最终放弃了)。

Rsync 是另一个很好的选择。使用与 SCP 命令完全相同 - 它也利用 SSHRsync 着重优化性能 - 它执行大量的复杂本地计算从而通过网络发送尽可能少的数据。从技术上讲,它致力于数据同步而不是纯传输文件 - 如果远程和本地内容相似,则只会发送增量。

同样,它也有其自身的缺点:发送方使用大量的 CPU 资源来计算要发送什么,并且接收方使用大量磁盘 IO 将数据按正确的顺序放在一起。与 OpenSSH 不同,Rsync 在大多数系统上并不预安装。

SCP 是一个简单的工具,它在复制文件方面做得很好,但较新的软件在很多方面都优于它。对于您信任的计算机之间的个人简单使用,SCP 仍然适合。

但是,如果您遇到性能问题或需要满足更高的安全标准,则上面列出的任何备选方案都比 SCP 更可取。选择最适合您需求的,然后试着开始使用。