<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>评论：Unicode详解</title>
	<atom:link href="http://tech.idv2.com/2008/02/21/unicode-intro/feed/" rel="self" type="application/rss+xml" />
	<link>http://tech.idv2.com/2008/02/21/unicode-intro/</link>
	<description>关注Web开发技术，关注Internet。</description>
	<lastBuildDate>Wed, 17 Mar 2010 14:27:52 -0700</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.5</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>来自：calabash</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-366667</link>
		<dc:creator>calabash</dc:creator>
		<pubDate>Tue, 09 Mar 2010 11:34:26 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-366667</guid>
		<description>文中提到：
“UTF-16由RFC2781规定，它使用两个字节来表示一个代码点。不难猜到，UTF-16是完全对应于UCS-2的，... ”

From wiki：
“UTF-16比起UTF-8，好处在于大部分字符都以固定长度的字节（2字节）储存，但UTF-16却无法相容于ASCII编码。

UTF-16可看成是UCS-2的父集。在没有辅助平面字符Mapping of Unicode character planes（surrogate code points）前，UTF-16与UCS-2所指的是同一的意思。但当引入辅助平面字符后，就称为UTF-16了。现在若有软件声称自己支援UCS-2编码，那其实是暗指它不能支援在UTF-16中超过2bytes的字集。对于小于0x10000的UCS码，UTF-16编码就等于UCS码。”</description>
		<content:encoded><![CDATA[<p>文中提到：<br />
“UTF-16由RFC2781规定，它使用两个字节来表示一个代码点。不难猜到，UTF-16是完全对应于UCS-2的，&#8230; ”</p>
<p>From wiki：<br />
“UTF-16比起UTF-8，好处在于大部分字符都以固定长度的字节（2字节）储存，但UTF-16却无法相容于ASCII编码。</p>
<p>UTF-16可看成是UCS-2的父集。在没有辅助平面字符Mapping of Unicode character planes（surrogate code points）前，UTF-16与UCS-2所指的是同一的意思。但当引入辅助平面字符后，就称为UTF-16了。现在若有软件声称自己支援UCS-2编码，那其实是暗指它不能支援在UTF-16中超过2bytes的字集。对于小于0&#215;10000的UCS码，UTF-16编码就等于UCS码。”</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：欧阳</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-312794</link>
		<dc:creator>欧阳</dc:creator>
		<pubDate>Wed, 23 Dec 2009 15:12:00 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-312794</guid>
		<description>博主辛苦了，收获不少：）</description>
		<content:encoded><![CDATA[<p>博主辛苦了，收获不少：）</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：zbguohua</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-312232</link>
		<dc:creator>zbguohua</dc:creator>
		<pubDate>Wed, 02 Dec 2009 05:35:00 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-312232</guid>
		<description>很有收获
如果单从易于理解来说
1.UNICODE 从概念上讲,是与 ASCII 编码规则相对应的,都是为了用二进制的机器码来表示字符(也就是文字)而制定的规则.
//UNICODE是这个种规则的名字,好比你叫张三,他叫李四

2.&quot;代码点&quot;(code point)相当于&quot;英文字符&quot;的ASCII编码
//好比 ASC(&quot;A&quot;)函数会返回65,也就是机器码的0100 0001

3.UCS-2,UCS-4是与UNICODE编码规则相关的&quot;名词&quot;,是表示&quot;字符编码&quot;(code point)使用几个字节进行编码
//废话,编码越长,能容纳的字符个数越多,好比手机号11位数比10位数容纳的用户个数大10倍一样

4.UTF16,UTF32,UTF8,还有big endian,little endian等等,可理解为&quot;字符编码&quot;(code point)的在硬件存储设备上的实际存放次序
//这个不太好比喻,好比是用winrar进行压缩还是用winzip进行压缩,只是算法不同,最终都能被正确的算法解压还原.</description>
		<content:encoded><![CDATA[<p>很有收获<br />
如果单从易于理解来说<br />
1.UNICODE 从概念上讲,是与 ASCII 编码规则相对应的,都是为了用二进制的机器码来表示字符(也就是文字)而制定的规则.<br />
//UNICODE是这个种规则的名字,好比你叫张三,他叫李四</p>
<p>2.&#8221;代码点&#8221;(code point)相当于&#8221;英文字符&#8221;的ASCII编码<br />
//好比 ASC(&#8221;A&#8221;)函数会返回65,也就是机器码的0100 0001</p>
<p>3.UCS-2,UCS-4是与UNICODE编码规则相关的&#8221;名词&#8221;,是表示&#8221;字符编码&#8221;(code point)使用几个字节进行编码<br />
//废话,编码越长,能容纳的字符个数越多,好比手机号11位数比10位数容纳的用户个数大10倍一样</p>
<p>4.UTF16,UTF32,UTF8,还有big endian,little endian等等,可理解为&#8221;字符编码&#8221;(code point)的在硬件存储设备上的实际存放次序<br />
//这个不太好比喻,好比是用winrar进行压缩还是用winzip进行压缩,只是算法不同,最终都能被正确的算法解压还原.</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：charlee</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-177388</link>
		<dc:creator>charlee</dc:creator>
		<pubDate>Thu, 17 Sep 2009 16:24:46 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-177388</guid>
		<description>@jinhr 谢谢你的指正，的确应该是U+10FFFF。已经改正了。</description>
		<content:encoded><![CDATA[<p>@jinhr 谢谢你的指正，的确应该是U+10FFFF。已经改正了。</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：jinhr</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-177268</link>
		<dc:creator>jinhr</dc:creator>
		<pubDate>Thu, 17 Sep 2009 15:22:21 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-177268</guid>
		<description>楼主，你在UTF-8这一节的表格中，最后一行代码点的范围你写成：U+10000..U+1FFFFF

但我查了资料，似乎应该是：U+10000..U+10FFFF

请指正。</description>
		<content:encoded><![CDATA[<p>楼主，你在UTF-8这一节的表格中，最后一行代码点的范围你写成：U+10000..U+1FFFFF</p>
<p>但我查了资料，似乎应该是：U+10000..U+10FFFF</p>
<p>请指正。</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：匿名</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-166471</link>
		<dc:creator>匿名</dc:creator>
		<pubDate>Sun, 13 Sep 2009 13:44:21 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-166471</guid>
		<description>而且UTF-8不再需要BOM字节。
⇒哈哈，楼主太绝对了吧！
前几天，我用java从数据库读出一个大的String，把这个String作为新建的csv文件的内容。String里面是中日英三种语言的。如果只是用UTF-8的话，Notepad++这种工具打开没问题，单用excel打开就乱码了。好像是因为excel默认的utf8文件是带bom的，所以我就在String前面加上了BOM，结果就全部工具打开全OK了～～～
＝＝》
用notepad保存的时候选择utf-8编码格式，用ultraedit查看，的确是没有bom的</description>
		<content:encoded><![CDATA[<p>而且UTF-8不再需要BOM字节。<br />
⇒哈哈，楼主太绝对了吧！<br />
前几天，我用java从数据库读出一个大的String，把这个String作为新建的csv文件的内容。String里面是中日英三种语言的。如果只是用UTF-8的话，Notepad++这种工具打开没问题，单用excel打开就乱码了。好像是因为excel默认的utf8文件是带bom的，所以我就在String前面加上了BOM，结果就全部工具打开全OK了～～～<br />
＝＝》<br />
用notepad保存的时候选择utf-8编码格式，用ultraedit查看，的确是没有bom的</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：匿名</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-155046</link>
		<dc:creator>匿名</dc:creator>
		<pubDate>Wed, 09 Sep 2009 02:51:10 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-155046</guid>
		<description>详细!谢谢</description>
		<content:encoded><![CDATA[<p>详细!谢谢</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：匿名</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-114834</link>
		<dc:creator>匿名</dc:creator>
		<pubDate>Tue, 25 Aug 2009 06:27:50 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-114834</guid>
		<description>学习了，收藏</description>
		<content:encoded><![CDATA[<p>学习了，收藏</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：匿名</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-100530</link>
		<dc:creator>匿名</dc:creator>
		<pubDate>Wed, 19 Aug 2009 14:02:43 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-100530</guid>
		<description>精简！</description>
		<content:encoded><![CDATA[<p>精简！</p>
]]></content:encoded>
	</item>
	<item>
		<title>来自：sizhefang</title>
		<link>http://tech.idv2.com/2008/02/21/unicode-intro/comment-page-1/#comment-24296</link>
		<dc:creator>sizhefang</dc:creator>
		<pubDate>Thu, 23 Jul 2009 01:46:53 +0000</pubDate>
		<guid isPermaLink="false">http://tech.idv2.com/2008/02/21/unicode-intro/#comment-24296</guid>
		<description>而且UTF-8不再需要BOM字节。
⇒哈哈，楼主太绝对了吧！
 前几天，我用java从数据库读出一个大的String，把这个String作为新建的csv文件的内容。String里面是中日英三种语言的。如果只是用UTF-8的话，Notepad++这种工具打开没问题，单用excel打开就乱码了。好像是因为excel默认的utf8文件是带bom的，所以我就在String前面加上了BOM，结果就全部工具打开全OK了～～～</description>
		<content:encoded><![CDATA[<p>而且UTF-8不再需要BOM字节。<br />
⇒哈哈，楼主太绝对了吧！<br />
 前几天，我用java从数据库读出一个大的String，把这个String作为新建的csv文件的内容。String里面是中日英三种语言的。如果只是用UTF-8的话，Notepad++这种工具打开没问题，单用excel打开就乱码了。好像是因为excel默认的utf8文件是带bom的，所以我就在String前面加上了BOM，结果就全部工具打开全OK了～～～</p>
]]></content:encoded>
	</item>
</channel>
</rss>

<!-- Dynamic Page Served (once) in 1.189 seconds -->
