E6968E

http://hawk.5ch.net/test/read.cgi/livejupiter/1514117814/

1: 風吹けば名無し 2017/12/24(日) 21:16:54.29 ID:WeoWNgz40EVE

日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、戸籍で使われているものをはじめおよそ5万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。

このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを正確に分析できたりするなどの効果が期待されています。

IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。


https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html?utm_int=news_contents_news-main_001

7: 風吹けば名無し 2017/12/24(日) 21:19:51.59 ID:Xu9ftiHcrEVE

斎藤
斉藤
齊藤

12: 風吹けば名無し 2017/12/24(日) 21:21:08.76 ID:bXwslhw5pEVE

>>7
斎の字ぜってえあんないらんわ

8: 風吹けば名無し 2017/12/24(日) 21:20:16.47 ID:AgyLL5SI0EVE

欠陥言語を直せや

9: 風吹けば名無し 2017/12/24(日) 21:20:26.26 ID:GWqY/6Ye0EVE

ふぉんとぉ?



10: 風吹けば名無し 2017/12/24(日) 21:20:30.09 ID:piZ00BqY0EVE

15年もかけたんか

13: 風吹けば名無し 2017/12/24(日) 21:21:15.34 ID:Lxk7G+FqaEVE

壮大な無駄遣い

16: 風吹けば名無し 2017/12/24(日) 21:22:23.04 ID:lTQtE/fZ0EVE

戸籍統一文字はコード化されていないだけで前からあったやろ

17: 風吹けば名無し 2017/12/24(日) 21:22:25.20 ID:UemwRPuW0EVE

無能政府

19: 風吹けば名無し 2017/12/24(日) 21:22:59.10 ID:2eZM9oIT0EVE

IPAっていつもこんな仕事してんの?

22: 風吹けば名無し 2017/12/24(日) 21:23:19.43 ID:trtlBwH+0EVE

これめんどいわ
山崎
山﨑
山嵜

27: 風吹けば名無し 2017/12/24(日) 21:23:57.03 ID:jLiJ+6vY0EVE

2byteで6万5千字やろ?ギリギリやな

32: 風吹けば名無し 2017/12/24(日) 21:24:26.28 ID:8VZOzlFJ0EVE

絶対どの斎藤やねんとか、どの渡辺やねんとかいう時間が出てくるわ

33: 風吹けば名無し 2017/12/24(日) 21:24:29.27 ID:x9406+bM0EVE

unicode出来てから何年経ってんねん

34: 風吹けば名無し 2017/12/24(日) 21:24:38.94 ID:53lwrDif0EVE

この機会に無駄な漢字消せばよかったのに

41: 風吹けば名無し 2017/12/24(日) 21:25:43.26 ID:ibS0HRa10EVE

ジャップの技術力低すぎやろ

46: 風吹けば名無し 2017/12/24(日) 21:26:06.95 ID:OjT3bSDNrEVE

これ6万字登録するバイトあったらやってたのに

50: 風吹けば名無し 2017/12/24(日) 21:26:35.25 ID:HT/Cw1gPdEVE

草彅剛

57: 風吹けば名無し 2017/12/24(日) 21:27:48.67 ID:I4gCRWrwdEVE

ワイの渡辺も追加されるんやろか

60: 風吹けば名無し 2017/12/24(日) 21:28:15.85 ID:lTQtE/fZ0EVE

燁(火へんに華)

65: 風吹けば名無し 2017/12/24(日) 21:28:55.11 ID:VtRD3Qkw0EVE

もうこれから日本語を使うやつはどんどん減っていくだけやのに
まあ無駄なことするなあ…

66: 風吹けば名無し 2017/12/24(日) 21:28:59.40 ID:Bk23LAmzaEVE

15年か
AIにやらせたらすぐ終わりそうやな
具体的にどんな作業か知らんけど

68: 風吹けば名無し 2017/12/24(日) 21:29:06.18 ID:E31uqoZv0EVE

中国人の手作りフォントってとんでもない数の漢字はいってるで

70: 風吹けば名無し 2017/12/24(日) 21:29:12.49 ID:axdgXQXY0EVE

どうでもいいような細かい違いなんて統一さして減らしていく方向にしろよ
アホちゃう

78: 風吹けば名無し 2017/12/24(日) 21:30:05.30 ID:dq9wsZpC0EVE

日本人の生産性が上がらない理由がよくわかる

91: 風吹けば名無し 2017/12/24(日) 21:31:56.12 ID:RAhrjCgp0EVE

渡辺
渡部
渡邉
渡邊

93: 風吹けば名無し 2017/12/24(日) 21:32:11.97 ID:qyBccaTT0EVE

ワイ漢字めっちゃ得意なのに台湾行くとぜんぜんわからないからそれも対応させろ

99: 風吹けば名無し 2017/12/24(日) 21:32:53.74 ID:GOIde5ER0EVE

旧字体の名前でIPAの受験用紙を書いたら
黒豆腐で帰って来た思い出

107: 風吹けば名無し 2017/12/24(日) 21:34:29.76 ID:hdkyj4rr0EVE

字もまともにわからん奴が書いたもんを字もまともにわからん役人が写してりゃめちゃくちゃになるのは当たり前やな
今やるべきは公的文書での字体の統一やったんやね

111: 風吹けば名無し 2017/12/24(日) 21:34:57.87 ID:8bwOkBnY0EVE

円記号とバックスラッシュ絶許

112: 風吹けば名無し 2017/12/24(日) 21:35:15.83 ID:rG8r6lhG0EVE

こんなん15日で済ませる作業やろ

118: 風吹けば名無し 2017/12/24(日) 21:36:33.88 ID:OEYBLc6y0EVE

細かい違いがたくさんある漢字って明治時代に書き間違えたまま登録されちゃった字とかなんやろ
そういうのむしろ無くしてほしいわアイデンティティ感じんわ

127: 風吹けば名無し 2017/12/24(日) 21:37:07.81 ID:YueP9wo2dEVE

ワタナベが統一されたら佐藤抜いて苗字人口トップとかなるんかな

130: 風吹けば名無し 2017/12/24(日) 21:37:27.29 ID:QyISZZRi0EVE

分家になるときに本家の漢字をちょっと変えてそれを名字にするからやなかったっけ

141: 風吹けば名無し 2017/12/24(日) 21:38:53.24 ID:Ui8OFnc8dEVE

>>130
そらもあるけど
基本は書き間違えとか
「あっミスって墨落として変なとこ繋がったけどええわ」とか
「変なとこに点ついたけどええわ」
ってなって残っとるのが多い

140: 風吹けば名無し 2017/12/24(日) 21:38:46.30 ID:5jjDxDdD0EVE

これを全部手作業でぽちぽち追加してたってまじ?
この国効率悪すぎやろ……

169: 風吹けば名無し 2017/12/24(日) 21:42:24.90 ID:wxM1IXXV0EVE

どうでもいいことに金使うな
さいとうなんか全部斉藤でええわ

193: 風吹けば名無し 2017/12/24(日) 21:46:25.28 ID:PXhiWlZepEVE

こんなアホな事に15年間も掛けてるから世界に取り残されるんだぞ