[自然言語]日本語と英語の壁は厚い

Posted under Webプログラミング by uechoco on 水曜日 7 11月 2007 at 11 : 09 : 36

英語と日本語の障壁がなぁ… JRubyの開発者言葉の壁に悪戦苦闘中 | エンタープライズ | マイコミジャーナル
http://journal.mycom.co.jp/news/2007/11/07/004/index.html

 英語が好きな日本人もいれば嫌いな日本人もいるわけだけど、中学・高校で英語の授業があるわけで、多くの日本人は最低限の英語を読めるかもしれない。プログラムを書いている日本人は英語が嫌いでも少しばかり英語が読めるかもしれない。好き・嫌いというのは当然、それに関わったからこそ出る感想であって、それに関わらなければ好きも嫌いもない。英語圏人にとって日本語はまさに好きでも嫌いでもない部類に入る。

 冒頭の記事は日本語の意味不明さに悪戦苦闘する英語圏のJRubyプログラマの話だ。記事によるとRubyが英語圏でコアメーリングリストから離れがちであるのは自然言語障壁の影響であり、またRuby on Railsが日本で少し遅れて普及し始めたのもやはり自然言語障壁の影響であるということだ。

 日本発のオープンソースとかってなかなか流行らないけど、それはそのオープンソースが日本語で完結してしまうからかもしれない。というかそれしかない。

 記事中では自動翻訳を解決策にあげているけど、日本語と英語の相互の翻訳はなかなか精度が上がらない気がする。それでもプロジェクトがいい方向に進めば問題はないが、現実的な手段になり得るか疑問だ。

 ぁ・・・翻訳APIを途中にはさむことができるメーリスシステムっていいかもね。


HTTP_Clientで国際対応のページを日本語で取得する方法

Posted under php by uechoco on 火曜日 31 7月 2007 at 12 : 58 : 14

少し前の記事に、HTTP_Clientでクッキーを使う方法を書きましたが、結果を書いていませんでした。無事、クッキーを再現することができました。

さて、今回もHTTP_Clientですが、もう少し基本的な使い方で躓いたことを書いときます。

最近では国際化に対応したWebサイトも多くなり、ブラウザの言語設定をApache側で認識してページを振り分けたり、スクリプト内部で翻訳処理したりといったことをしてくれます。
そういった国際化対応ページにHTTP_Clientでアクセスした場合、(詳しく調べてはいませんが)デフォルトで英語のブラウザとして認識されて、アメリカーンな結果を返してくれます。われわれは日本人です。日本語で欲しいんです。

そんなときはパラメータやヘッダーを設定してやればいいわけです。HTTP_ClientはHTTP_RequestのラッパーなのでHTTP_Requestで使うパラメータやヘッダーを送ることができます。

PHP:
  1. var $_http_client_default_param = array('timeout' => 10, 'allowRedirects' => true, 'maxRedirects' => 2);
  2. var $_http_client_default_header = array('Accept-Language' => 'ja-JP,ja;q=0.9,en;q=0.8');
  3. $client =& new HTTP_Client($this->_http_client_default_param, $this->_http_client_default_header);

今回大事なのは$_http_client_default_headerで設定したAccept-Languageヘッダーです。これはHTTPヘッダのHTTP_ACCEPT_LANGUAGEに対応します。書式や意味は他のサイトを参照してください。

他にもいろいろなオプションを設定することができますが、今回はここまで。


Copyright © 2012 うえちょこ@ぼろぐ. WP Theme created by Web Top.