|
楼主 |
发表于 2015-11-9 20:33:50
|
显示全部楼层
把UNICODE字符转为HTML实体字符,用于处理外来语字母,几行python代码搞定 7 ?, W+ D/ X) h5 R
7 m$ b- F( S( m" B- def uc_to_hc(text):
# Y9 g$ Q' n( d* f5 v - rst = []
" U5 N/ V; o% {0 Q2 i - for ch in text:6 p+ N8 I/ p& p: W' H% f
- val = ord(ch)% F) l2 H0 Q3 u6 s+ z( ^
- if val<=0x7F:4 `$ b( q% l+ c: C/ `. ^4 |0 p6 T
- rst.append(ch)2 `' N3 G" r! ^! H1 w D6 }, ]; [" l/ H
- else:
5 `, D2 d; y7 y - rst.append('{0}{1:0>4X}{2}'.format('&#x', val, ';')): _ W" r. f/ z8 e# |
- return ''.join(rst)) P5 L9 b5 Y+ n" M Z8 M
复制代码 |
|