您当前的位置: 首页 > 数据库教程 > Oracle教程 > Oracle 9i中应用COMPOSE和UNISTR创建沉音

Oracle 9i中应用COMPOSE和UNISTR创建沉音

作者:guanchaofeng 来源:不详 发布时间: 2009-05-09 12:44 点击:
很多语言,包括英语在内,都使用沉音字符(accentedcharacter)。因为这些字符不属于ASCII字符集,所以如果不查看Unicode值也不使用Unicode编辑器并将其转成一个已知字符集,就很难编写使用这些字符的代码。 Oracle9i引入了COMPOSE函数,该函数接受一串Unico

Oracle 9i中应用COMPOSE和UNISTR创建沉音

  很多语言,包括英语在内,都使用沉音字符(accentedcharacter)。因为这些字符不属于ASCII字符集,所以如果不查看Unicode值也不使用Unicode编辑器并将其转成一个已知字符集,就很难编写使用这些字符的代码。
  
  Oracle9i引入了COMPOSE函数,该函数接受一串Unicode字符并规则化其文本。这就意味着它可以接受一个字母和一个组合标记,比如说‘a'(Unicode字符0097)和沉音符(Unicode字符0300),然后创建一个单独的由两个标记组合而成的字符。COMPOSE使用特殊的组合标记,而没有使用ASCII中相应的音节标记,它所使用的特殊的组合标记是Unicode标准的一部分。上面的例子的结果应该是Unicode字符00E0(有一个沉音符的小写拉丁字母‘a')。
  
  在ANSI中最常见的组合字符有:
  
  ·U+0300:沉音符(graveaccent)(`)。
  
  ·U+0301:重音符(acuteaccent)(')。
  
  ·U+0302:抑扬音符号(circumflexaccent)(^)。
  
  ·U+0303:颚化符号(tilde)(~)。
  
  ·U+0308:元音变音。
  
  如果没有特殊的软件或者键盘驱动程序的话,很难在键盘上输入Unicode字符0097和0300。因此,以纯ASCII文本输入Unicode序列的一个方法是使用UNISTR函数。这个函数接受一个ASCII字符串然后以国家字符集(通常作为16位Unicode或者UTF-8字符集安装)创建一个Unicode字符的序列。它使用十六进制占位符序列映射任何非ASCII字符,映射方式与Java类似。
  
  要输入a后接一个沉音符组合字符的序列,可以使用UNISTR(‘a\0300'),而不要试图直接在代码中输入字符。这个函数在任何字符集以及任何具有基于Unicode的国家字符集的数据库下都可以正常运行。可以将多个组合字符放在函数中——可以在UNISTR函数中混合使用ASCII和Unicode占位符。例如,可以像下面这样使用UNISTR函数:
  
  selectCOMPOSE(UNISTR('Unlessyouarenai\0308ve,meetmeatthecafe\0301withyourre\0301sume\0301.'))fromdual;
  
  在将UNISTR函数的输出与COMPOSE组合时,可以在不查找任何值的情况下生成一个Unicode字符。例如:
  
  select'itistrue'ifcompose(unistr('a\0300'))=unistr('\00e0');
  
  COMPOSE函数返回一个NVARCHAR2字符串,返回的NVARCHAR2字符串通常是基于Unicode的。如果是在本地使用这些字符,在结果中具有一个隐式地TO_CHAR时,数据库将尝试将Unicode字符映射到本地字符集。不是所有的字符都可以被映射,有一些字符组合在COMPOSE中不能工作,因为Unicode协会没有在Oracle所用的级别定义它们。
  
  要快速地检查字符如何在一个特定的环境下查询,可以运行一个与下面的脚本类似的脚本,以查看在输出组合字符如何被映射。你可能需要确定一下NLS_LANG设置以确保这些字符正确地返回:
  
  createorreplacetypehexrange_tblastableofvarchar2(4);/showerrors;createorreplacefunctionhexrange(n1varchar2,n2varchar2)returnhexrange_tblpipelinedisbeginforiinto_number(n1,'000X')..to_number(n2,'000X')looppiperow(to_char(i,'FM000X'));endloop;return;endhexrange;/showerrors;selectcolumn_valuecomposer,compose(unistr('a\'||column_value))a,compose(unistr('c\'||column_value))c,compose(unistr('e\'||column_value))e,compose(unistr('i\'||column_value))i,compose(unistr('n\'||column_value))n,compose(unistr('o\'||column_value))o,compose(unistr('r\'||column_value))r,compose(unistr('s\'||column_value))s,compose(unistr('u\'||column_value))u,compose(unistr('y\'||column_value))yfromtable(hexrange('0300','0327'))x;
  
  下面轻松一下,这里有一小段PL/SQL脚本,这段脚本使用COMPOSE和UNISTR创建一种特殊效果,很多SMS用户、黑客和垃圾邮件发送者都使用这种效果使可读英文文本难于扫描,因为它使用字符重音版本的一个随机序列。我使用DBMS_RANDOM随机选取一个可由不同字符使用的组合字符,然后让SQL进行组合并进行反向转换以生成ANSI/Latin-1输出。这段脚本在代码中使用了EMP表的ENAME字段。
  
  setserveroutputon;declare--thesecombinationsworkunderANSI,atleasta_combnvarchar2(50):=unistr('\0300\0301\0302\0303\0308\030A');c_combnvarchar2(50):=unistr('\0327');e_combnvarchar2(50):=unistr('\0300\0301\0302\0308');i_combnvarchar2(50):=unistr('\0300\0301\0308');n_combnvarchar2(50):=unistr('\0303');o_combnvarchar2(50):=unistr('\0300\0301\0302\0303\0308');u_combnvarchar2(50):=unistr('\0300\0301\0302\0308');y_combnvarchar2(50):=unistr('\0301\0308');l_idxinteger;l_enamenvarchar2(50);chnchar;l_junkvarchar2(50);begindbms_random.initialize(to_char(sysdate,'SSSSS'));forrowin(selectenamefromemp)loopl_ename:=row.ename;l_junk:=null;foriin1..length(l_ename)loopch:=substr(l_ename,i,1);caselower(ch)when'a'thenl_junk:=l_junk||compose(ch||substr(a_comb,mod(abs(dbms_random.random),length(a_comb))+1,1));when'c'thenl_junk:=l_junk||compose(ch||substr(c_comb,mod(abs(dbms_random.random),length(c_comb))+1,1));when'e'thenl_junk:=l_junk||compose(ch||substr(e_comb,mod(abs(dbms_random.random),length(e_comb))+1,1));when'i'thenl_junk:=l_junk||compose(ch||substr(i_comb,mod(abs(dbms_random.random),length(i_comb))+1,1));when'n'thenl_junk:=l_junk||compose(ch||substr(n_comb,mod(abs(dbms_random.random),length(n_comb))+1,1));when'o'thenl_junk:=l_junk||compose(ch||substr(o_comb,mod(abs(dbms_random.random),length(o_comb))+1,1));when'u'thenl_junk:=l_junk||compose(ch||substr(u_comb,mod(abs(dbms_random.random),length(u_comb))+1,1));when'y'thenl_junk:=l_junk||compose(ch||substr(y_comb,mod(abs(dbms_random.random),length(y_comb))+1,1));elsel_junk:=l_junk||ch;endcase;endloop;dbms_output.put_line(to_char(l_junk));endloop;end;/showerrors;

分享到:
本文"Oracle 9i中应用COMPOSE和UNISTR创建沉音"由远航站长收集整理而来,仅供大家学习与参考使用。更多网站制作教程尽在远航站长站。
顶一下
(0)
0%
踩一下
(0)
0%
[点击 次] [返回上一页] [打印]
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 密码: 验证码:
关于本站 - 联系我们 - 网站声明 - 友情连接- 网站地图 - 站点地图 - 返回顶部
Copyright © 2007-2013 www.yhzhan.com(远航站长). All Rights Reserved .
远航站长:为中小站长提供最佳的学习与交流平台,提供网页制作与网站编程等各类网站制作教程.
官方QQ:445490277 网站群:26680406 网站备案号:豫ICP备07500620号-4