http://hawk.5ch.net/test/read.cgi/livejupiter/1514117814/
1: 風吹けば名無し 2017/12/24(日) 21:16:54.29 ID:WeoWNgz40EVE
日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。
コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、戸籍で使われているものをはじめおよそ5万字に上っています。
中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。
このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。
この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを正確に分析できたりするなどの効果が期待されています。
IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html?utm_int=news_contents_news-main_001
7: 風吹けば名無し 2017/12/24(日) 21:19:51.59 ID:Xu9ftiHcrEVE
斎藤
斉藤
齊藤
12: 風吹けば名無し 2017/12/24(日) 21:21:08.76 ID:bXwslhw5pEVE
>>7
斎の字ぜってえあんないらんわ
8: 風吹けば名無し 2017/12/24(日) 21:20:16.47 ID:AgyLL5SI0EVE
欠陥言語を直せや
9: 風吹けば名無し 2017/12/24(日) 21:20:26.26 ID:GWqY/6Ye0EVE
ふぉんとぉ?
10: 風吹けば名無し 2017/12/24(日) 21:20:30.09 ID:piZ00BqY0EVE
15年もかけたんか
13: 風吹けば名無し 2017/12/24(日) 21:21:15.34 ID:Lxk7G+FqaEVE
壮大な無駄遣い
16: 風吹けば名無し 2017/12/24(日) 21:22:23.04 ID:lTQtE/fZ0EVE
戸籍統一文字はコード化されていないだけで前からあったやろ
17: 風吹けば名無し 2017/12/24(日) 21:22:25.20 ID:UemwRPuW0EVE
無能政府
19: 風吹けば名無し 2017/12/24(日) 21:22:59.10 ID:2eZM9oIT0EVE
IPAっていつもこんな仕事してんの?
22: 風吹けば名無し 2017/12/24(日) 21:23:19.43 ID:trtlBwH+0EVE
これめんどいわ
山崎
山﨑
山嵜
27: 風吹けば名無し 2017/12/24(日) 21:23:57.03 ID:jLiJ+6vY0EVE
2byteで6万5千字やろ?ギリギリやな
32: 風吹けば名無し 2017/12/24(日) 21:24:26.28 ID:8VZOzlFJ0EVE
絶対どの斎藤やねんとか、どの渡辺やねんとかいう時間が出てくるわ
33: 風吹けば名無し 2017/12/24(日) 21:24:29.27 ID:x9406+bM0EVE
unicode出来てから何年経ってんねん
34: 風吹けば名無し 2017/12/24(日) 21:24:38.94 ID:53lwrDif0EVE
この機会に無駄な漢字消せばよかったのに
41: 風吹けば名無し 2017/12/24(日) 21:25:43.26 ID:ibS0HRa10EVE
ジャップの技術力低すぎやろ
46: 風吹けば名無し 2017/12/24(日) 21:26:06.95 ID:OjT3bSDNrEVE
これ6万字登録するバイトあったらやってたのに
50: 風吹けば名無し 2017/12/24(日) 21:26:35.25 ID:HT/Cw1gPdEVE
草彅剛
57: 風吹けば名無し 2017/12/24(日) 21:27:48.67 ID:I4gCRWrwdEVE
ワイの渡辺も追加されるんやろか
60: 風吹けば名無し 2017/12/24(日) 21:28:15.85 ID:lTQtE/fZ0EVE
燁(火へんに華)
65: 風吹けば名無し 2017/12/24(日) 21:28:55.11 ID:VtRD3Qkw0EVE
もうこれから日本語を使うやつはどんどん減っていくだけやのに
まあ無駄なことするなあ…
66: 風吹けば名無し 2017/12/24(日) 21:28:59.40 ID:Bk23LAmzaEVE
15年か
AIにやらせたらすぐ終わりそうやな
具体的にどんな作業か知らんけど
68: 風吹けば名無し 2017/12/24(日) 21:29:06.18 ID:E31uqoZv0EVE
中国人の手作りフォントってとんでもない数の漢字はいってるで
70: 風吹けば名無し 2017/12/24(日) 21:29:12.49 ID:axdgXQXY0EVE
どうでもいいような細かい違いなんて統一さして減らしていく方向にしろよ
アホちゃう
78: 風吹けば名無し 2017/12/24(日) 21:30:05.30 ID:dq9wsZpC0EVE
日本人の生産性が上がらない理由がよくわかる
91: 風吹けば名無し 2017/12/24(日) 21:31:56.12 ID:RAhrjCgp0EVE
渡辺
渡部
渡邉
渡邊
93: 風吹けば名無し 2017/12/24(日) 21:32:11.97 ID:qyBccaTT0EVE
ワイ漢字めっちゃ得意なのに台湾行くとぜんぜんわからないからそれも対応させろ
99: 風吹けば名無し 2017/12/24(日) 21:32:53.74 ID:GOIde5ER0EVE
旧字体の名前でIPAの受験用紙を書いたら
黒豆腐で帰って来た思い出
107: 風吹けば名無し 2017/12/24(日) 21:34:29.76 ID:hdkyj4rr0EVE
字もまともにわからん奴が書いたもんを字もまともにわからん役人が写してりゃめちゃくちゃになるのは当たり前やな
今やるべきは公的文書での字体の統一やったんやね
111: 風吹けば名無し 2017/12/24(日) 21:34:57.87 ID:8bwOkBnY0EVE
円記号とバックスラッシュ絶許
112: 風吹けば名無し 2017/12/24(日) 21:35:15.83 ID:rG8r6lhG0EVE
こんなん15日で済ませる作業やろ
118: 風吹けば名無し 2017/12/24(日) 21:36:33.88 ID:OEYBLc6y0EVE
細かい違いがたくさんある漢字って明治時代に書き間違えたまま登録されちゃった字とかなんやろ
そういうのむしろ無くしてほしいわアイデンティティ感じんわ
127: 風吹けば名無し 2017/12/24(日) 21:37:07.81 ID:YueP9wo2dEVE
ワタナベが統一されたら佐藤抜いて苗字人口トップとかなるんかな
130: 風吹けば名無し 2017/12/24(日) 21:37:27.29 ID:QyISZZRi0EVE
分家になるときに本家の漢字をちょっと変えてそれを名字にするからやなかったっけ
141: 風吹けば名無し 2017/12/24(日) 21:38:53.24 ID:Ui8OFnc8dEVE
>>130
そらもあるけど
基本は書き間違えとか
「あっミスって墨落として変なとこ繋がったけどええわ」とか
「変なとこに点ついたけどええわ」
ってなって残っとるのが多い
140: 風吹けば名無し 2017/12/24(日) 21:38:46.30 ID:5jjDxDdD0EVE
これを全部手作業でぽちぽち追加してたってまじ?
この国効率悪すぎやろ……
169: 風吹けば名無し 2017/12/24(日) 21:42:24.90 ID:wxM1IXXV0EVE
どうでもいいことに金使うな
さいとうなんか全部斉藤でええわ
193: 風吹けば名無し 2017/12/24(日) 21:46:25.28 ID:PXhiWlZepEVE
こんなアホな事に15年間も掛けてるから世界に取り残されるんだぞ