2004年12月24日(金)の日誌 現時点ではアマゾンのサーチインサイドに参加しない
2004年12月24日(金)の日誌

現時点ではアマゾンのサーチインサイドに参加しない

アマゾンのサーチインサイドについての説明会があった。

サーチインサイドというのは、本の中のテキストも検索できるようにして、求めている情報が載っている本を探すときには便利というものである、実現すれば。しかし、実際にはつかいものになるのだろうか。スキャンした画像をOCRでテキスト化するわけだが、現時点ではまだ、90パーセントの後半とのことらしい。A5判の本の場合、1ページが1000文字ほどあるからかなり多い文字が誤読される。もし、99パーセントでも、10文字誤読される。どういうことかというと、検索しようとしている言葉の中に誤読が含まれていれば、検索してもでてこないということになる。99パーセントではないので、もっと多い文字数が間違って読まれるということである。アマゾンで検索して、でてこないと本がでていない、あるいは在庫が切れていると誤解する人が多い。このサーチインサイドででてこなければ、そのキーワードが含まれている本がないと誤解する人がでてきかねない。これは問題だ。

アマゾンで不思議なのは、詳細サーチの中身だ。まず、トピック欄での検索を使ってみよう。「日本語学」ということばを入れてみてほしい。また、「ボランティア、市民」と入れてほしい。BK1で同じことをやると違いがよく分かる。また、小山陽子という名前を「著者」欄に入れて検索してほしい。その次には「小山」と「陽子」の間に半角を入れて検索してみてほしい。(小山さんは、アドワーズ広告の権威)これらの検索結果を見ると、アマゾンの検索がどのレベルかがわかるだろう。サーチインサイドより先にやるべきことがあるのではないだろうか。

この結果として、ひつじ書房は、現時点ではサーチインサイドに参加しないことに決めた。

「本の出し方」「学術書の刊行の仕方」スタッフ募集について日誌の目次

日誌の目次へ
ホームページに戻る


ご意見、ご感想をお寄せ下さい。

房主
i-matumoto@hituzi.co.jp