这些都是单个UTF-8字符吗?
我希望能够以编程方式将这些字符插入剪贴板。他们每个人都是单个UTF-8角色吗?如果不是,他们在什么编码? 我正在查看虽然UTF-8字符表http://www.utf8-chartable.de/unicode-utf8-table.pl拉丁字母,但无法找到它们。这些都是单个UTF-8字符吗?
你在你的问题挂一个 一个 一个 一个 一个 ü ü ü ü ü Ø Ø Ø Ë Ë Ë
字符表只覆盖Unicode的Basic Latin(U + 0000..U + 007F)和Latin-1 Supplement(U + 0080..U + 00FF)块中的码点。您显示的每个字符都是Unicode的Latin Extended Additional块(U + 1E00..U + 1EFF)中的码点。当以UTF-8编码的,这些字符占用每3个字节,内容如下:
Ấ
= U + 1EA4 = E1 BA A4
Ầ
= U + 1EA6 = E1 BA A6
Ẩ
= U + 1EA8 = E1 BA A8
Ẫ
= U + 1EAA = E1 BA AA
Ậ
= U + 1EAC = E1 BA AC
Ứ
= U + 1EE8 = E1 BB A8
Ừ
= U + 1EEA = E1 BB AA
Ử
= U + 1EEC = E1 BB AC
Ữ
= U + 1EEE = E1 BB AE
Ự
= U + 1EF0 = E1 BB B0
Ỡ
= U + 1EE0 = E1 BB A0
Ợ
= U + 1EE2 = E1 BB A2
Ở
= U + 1EDE = E1 BB 9E
Ề
= U + 1EC0 = E1 BB 80
Ể
= U + 1EC2 = E1 BB 82
Ễ
= U + 1EC4 = E1 BB 84
根据您的平台上,你可能会或可能无法储存UTF-8在剪贴板上。例如,在Windows上,只能将文本存储为ANSI或UTF-16(除非您创建自定义剪贴板格式来保存UTF-8)。
是的,它们都有单独的Unicode代码点,从U + 1EA4开始。 – deceze