要望ではないですが、気になった点の報告です。
例えば3シーズンでは定番のモンベル#3ですが…
http://outdooritem.net/sleeping_bag/1380.html
山渓でも取り扱っていたりします。
http://od-yamakei.co.jp/goods/S9999990218773.phpスーパーストレッチとSS.との表記の違いがリンクに影響を
与えているのでしょうか?
以上のような報告があったので、ついでにアウトドア用品価格比較の中身をちょっと解説してみたいと思います。
なるべくプログラミングとかシステムなどがわからない人にもわかるように解説してみます。(結局固い内容には変わりないんですが)
アウトドア用品価格比較の価格情報の掲載までには
- 価格情報の取得
- 価格情報と商品データの紐付け
という二つの手順を踏んでいます。
この両方をうまくパスした価格情報だけがアウトドア用品価格比較のサイトに反映されることになります。
これらの各手順を簡単に解説します。
価格情報の取得
まずアウトドア用品価格比較に掲載されている価格の情報は、各オンラインショップのウェブサイト内に表示されている内容、もしくは公開されているデータ取得用の仕組み(WebAPI)から取得しています。
このうちウェブサイト内に表示されている内容から取得する方が難しく、取得漏れが起こりやすくなります。
実は山渓はこちらのケースで、報告の例では取得漏れのため価格情報が掲載されていません。
楽天やYahoo!に店舗を構えているショップはデータ取得用の仕組みを持っているので、価格情報の取得がやりやすく、取得漏れはかなり起こりにくくなっています。
余談ですが最近は企業などが商品データなどを取得しやすい形にして公開することで個人でも豊富な情報量を持ったサービスを作ることが容易になっています。
こうしてサービスを作ることをマッシュアップと呼びます。アウトドア用品価格比較もマッシュアップによるサービスと言えます。
ちなみにナチュラムも山渓と同じくウェブサイトからの取得を行っていますが、サイトのつくりが洗練されていて内容の規則性を掴みやすいのでこちらはけっこう情報を取得しやすくなっています。
さすが業界随一のシステムなだけありますね。
価格情報と商品データの紐付け
さて価格情報を取得しただけではまだ表示はできません。
その価格情報がどの商品と結び付くものであるかどうかまだわからないからです。
次に商品データと紐づける必要があります。
この商品データはあらかじめアウトドア用品価格比較に登録されているものです。
これが複数ショップの価格情報を比較するための核となります。このデータがないと比較が成り立ちません。
で、実はこの紐付けがまたちょっと面倒だったりします。
各ショップで価格情報を含んだ商品情報のフォーマットがそれぞれ違うのでなかなか一筋縄ではいきません。
例えば商品名で判別しようにも
スーパーストレッチとSS.との表記の違いがリンクに影響を
与えているのでしょうか?
という指摘のようにショップごとに商品名の表記が違ったりするのです。困ったものですね。
実際のところ、こうした事情に振り回されて現在は紐付けしきれていないデータも多数あります。
現在この紐付けは現在は人力と自動の両方で行っています。
人力で行って規則性がわかればそれを自動化する仕組みを作る、というのが基本的な流れです。
行き着く先の最終目標は完全自動化ですが、それまでにはいくつも細かい改善を重ねる必要があると感じています。
ちなみに型番を使って紐付けする仕組みなんかもついこないだ実装してみたのですが、ショップによっては型番を取得できなかったり、サイズ違い色違いで型番が微妙に違ったりなど、やっぱり一筋縄ではいかない流れになっています。
それでもだいぶ紐付けできるケースが増えたのでよかったですが。
今後の課題
というわけでより多くの価格情報をきちんと取得して、それらをきちんと紐付けする仕組みを作るというのが今後の課題です。
正直言ってまだ現状には満足していません。
ただ一ヶ月前よりは現在の方が確実によくなってますので、一ヶ月後にはまた現在よりもよくなっているはずです。
こういう裏方の仕組みも日々着々と改善してますので、長い目で見ていただければなーと思います。

なるほど、勉強になります。
WebAPIについては昔自宅サーバにてやってみようかと思ったんですが、なかなかに敷居が高くて…断念しました。
今であれば参考書籍なども大分出てきているんでしょうね。
またチャレンジしてみようかな…
ちょうどマッシュアップのコンテストとかもあるのでこれを目標にチャレンジしてみるのもいいかもしれないです。
Mashup Award 4th
http://mashupaward.jp/