UTF-8 编码里,一个汉字占用多少个字节?

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。
Continue reading UTF-8 编码里,一个汉字占用多少个字节?

Ubuntu 操作系统的电驴下载软件 – mldonkey

mldonkey 是个很不错的下载软件,支持电驴、BT、HTTP等支持,且还是不断增加,什么时候要能支持迅雷就好了,呵呵。很多人安装了 mldonkey 却不知道怎么去用,实际上是很简单的。首先来了解一下mldonkey是怎样的架构。 mldonkey 有服务器端和客户端。服务器端(mldonkey-server)是用来下载的,是主要组件。客户端就很多了,因为服务器端支持好多的管理方式,如Web、GUI应用程序等等。服务器端作为系统的服务运行的。我们需要使用客户端管理它。
Continue reading Ubuntu 操作系统的电驴下载软件 – mldonkey