2016年02月19日

ツイッター公式検索の謎と現時点での対処方法について

はてなブックマークに登録

(この記事は 2016年 2月時点の観察に基づくものです)

サイト上の記事に関するツイートは当事者にとっても閲覧する側にとっても興味深いものです。ただ、ツイッター公式の検索機能を使って所定の URL を含むツイート一覧を取得する際に、クエリ文字列の指定方法により検索結果が大きく異なるケースがあることに気がつきました。また、その現象はサイトにより一様ではありません。以下にその内容を控えます。お手元のサイトではどうでしょう?

話題の背景

米 Twitter 社は Web パーツとして提供中のツイートボタンへのカウンタ表示を 2015年 11月 20日に廃止しました。

この措置をめぐっては様々な話題がネットを賑わせましたが、一私企業による無償系のサービスにおいて仕様変更が発生することは避けがたい側面もあるため利用に際しては恩恵を享受すると同時にやはりこのような可能性についても含んでおくべきでしょう。下記のような非公式の代替 API の利用へ乗り換えることでツイート数表示を維持しているサイトも見受けられます。

ただ、カウンタ廃止そのものは甘受するとしても、従来カウンタ表示位置にリンクの設置されていたツイートの一覧表示(検索)機能も利用できなくなったことはサイト運営者にとってもサイト訪問者にとっても不便で、せっかくの SNS 連携であるにもかかわらずソーシャル性が少なからず削がれた残念な状況となりました。

そのため自前で一覧表示用のリンクを設置するサイトが増えています。当ブログにも 2015年末にツイートボタンの右側に「見る」リンクを加えました。
このツイート一覧表示用のリンクの設置に際し、今まで気づかずにいた発見がありました。

検索対象とする URL の指定方法で検索結果が異なる??

https://twitter.com/search-home - ツイッター公式検索画面)

当「DSAS 開発者の部屋」ブログにおいて、従来のカウンタつきツイートボタンの頃から次の現象を見ていました。

  • ツイートカウンタのクリックで一覧表示されるツイートのうち、日数の経ったものは順次消えていく
過去のツイートが時間の経過とともにツイッター公式の検索結果から消えてゆく現象は「普通のこと」であり「そういうもの」だと思っていました。一例として当ブログにおいて閲覧数の多いエントリのひとつである次の記事をピックアップしてみます。

このエントリは 2006年 12月公開のかなりふるいものです。現時点で、本項冒頭に掲載のツイッター公式検索を使って上記の URL を含むツイートを照会すると以下の結果となります。

https://twitter.com/search?f=tweets&q=http%3A%2F%2Fdsas.blog.klab.org%2Farchives%2F50860867.html%20&src=typd

この「見つかりませんでした」という結果は見慣れたもので、これを目にした場合はこのところ当該記事についてのツイートはなかったものと認識しごく普通の結果として受けとめていました。

ところが、自前で「見る」リンクを設置する作業の途中で、ふとしたコピペミスで
「http://dsas.blog.klab.org/archives/50860867.html」ではなく
「dsas.blog.klab.org/archives/50860867.html」と指定したところ意外な結果となりました。

https://twitter.com/search?f=tweets&q=dsas.blog.klab.org%2Farchives%2F50860867.html&src=typd

50件以上のツイートがヒットします。もっともふるいものは「2008年 5月 28日」とあります。少し驚きました。

このように、当ブログでのツイート検索においては「http://」のスキーム記述部分をクエリ文字列に含む・含まないの違いで検索結果が大きく異なります。ツイート本文中の当該記事の URL 表示箇所は「dsas.blog.klab.org/archives/…」の要領でありたしかに「http://」は含まれませんが、記述が短縮 URL であっても適切に拾われており、また、日数の経っていない新鮮なツイートであればどちらの書式で照会しても同じ検索結果となるためどうも事情が判然としません。

不思議な結果ではありますが、このことは同時に有用でもあると考えました。「見る」リンクの内容は自前で記述するのですから、この書式にすることで旧ツイートボタン上のリンクからは拾ってくることのできなかったツイートを参照できるのであればそれは一方では喜ばしいことです。記事についてのツイートは貴重な財産であり、投稿された方のモチベーションを下げないためにもその適切な表示は重要でしょう。

そんなわけで、当ブログでは暫定的にツイートの「見る」リンクでの検索クエリ文字列を「http://」を含めない内容としています。この措置により以前は参照できなかった過去ツイートの一覧を表示可能となりました。この件は今後も観察を続け、もし事情に変化があればそれに追随することを想定しています。

過去ツイートの検索そのものが可能となった背景

今回の一件に関連する情報を探す過程で、米 Twitter 社が 2014年 11月に 2006年 3月以降のすべての公開ツイートのインデクシングを完了し検索可能とした旨を発表していたことを知りました。この話題は当時見たような見なかったような、、いずれにせよその時点では特に興味がなかったはずなので流していたかもしれません。

端的には、公式の検索機能から前掲のように 2008年のツイートを参照可能であることには受け皿として論理的な整合性があり、あとは適切な方法で検索を行えばよいということですね。

謎はさらに

上に書いたように、当ブログにおいては現時点では記事に対するツイートを検索する際のクエリ文字列に「http://」のスキーム文字列を付与しないことが有効であることはほぼ確実のようです。

その一方で、このことがツイッター公式検索における一般論ではないことにも気づきました。手元で確認した範囲では大きくみっつのパターンがあるようです。以下にそれぞれの実例を挙げてみます。いずれも例示のみを目的に特別な意図なしに選んで確認を行ったエントリでありそれぞれの内容は本記事の内容と関係のあるものではありません。

※各サイト様には事前のご連絡なしに個別の記事へのリンクを掲載させて頂いております。もし何らかのご支障がありましたら速やかにリンクを削除しますので、その場合には大変お手数ですが本記事末尾のコメント用フォームよりお知らせ下さい

※以下の情報はすべて 2016年 2月時点の確認結果です

パターン A:「http://」を付与すると過去ツイート拾わず・付与しなければ拾う

(つまり 当ブログと同じケースです)

例:弊社「KLabGames Tech Blog」の記事より

例:「ライブドアニュース」様の記事より 例:「BLOGOS」様の記事より 例:「バズプラスニュース」様の記事より 例:「サイボウズエンジニアのブログ」様の記事より 例:「痛いニュース」様の記事より

パターン B:「http://」を付与すると過去ツイートを拾う・付与しなければ拾わず

例:「日経 BP ネット」様の記事より

例:「ITmedia ニュース」様の記事より 例:「ケータイ Watch」様の記事より 例:「JCAST ニュース」様の記事より

パターン C:「http://」を付与してもしなくても同様に過去ツイートを拾う

例:「GIGAZINE」様の記事より

例:「CNET Japan」様の記事より 例:「TechCrunch Japan」様の記事より 例:「CodeZine」様の記事より 例:「ASCII.jp」様の記事より 例:「ガジェット通信」様の記事より

所感など

上に挙げたみっつのパターンのうち、もっとも好ましいのはやはり「パターン C: "http://" を付与してもしなくても同様に過去ツイートを拾う」でしょう。それぞれの違いが何に起因するものであるかは今のところわかりませんが最後に少し整理してみます。

  • 各サイトのツイートボタンを押下しメッセージ記述用の雛形を確認してもこれといって特徴的な要素はみとめられず、そもそもツイートをポストする際は単に所定のページの URL を併記するのみであり当該ツイートボタンの使用・不使用を含め投稿者をサイト側の何らかのルールに従わせることはできないはず
  • 上のそれぞれの例を見る限り、URL のパターンによって検索時の所作が変わる規則性のようなものは想定し難い
  • となると、検索処理側で何らかの要素を加味している可能性が考えられる。当該システムは人間の手と判断の介在の度合いが大きいのかもしれない。こういう記事もあった
    ツイッター検索でURL付きのツイートが表示されない (2015-06-30) - 「Pagent」様のブログより
    自分のブログ記事のツイッター検索の結果が1件しか表示されない
    
    その後、別で書いている自分のブログでのことだが、上記同様ツイート数表示を
    クリックした時に表示されるページ(URLをツイッター検索した結果のページ)で、
    何人かツイートしてくれている人がいるのに、ツイートが1件しか表示されない
    状態になっていた。「トップ」でも「ライブ」でも1件のみ。誰のツイートが
    表示されるかは、リツイート数の多いツイートだったり、最新のツイートだったり。
    これではツイートしてくれる人も意欲を削がれるに違いない。
    
    上記の「Twitterヘルプセンター」から日本語で報告してみたが、しばらく待っても
    変化が無い。再度下手くそな英語で報告してみた。
                   :
    1〜2時間ほどすると、ほぼすべてのツイートが表示される状態に改善した。 
                   :
    
2016年 1月 12日に Twitter 社公式サイトの以下のフォームから当ブログ(dsas.blog.klab.org)記事へのツイート検索結果について問い合わせを行い、あわせて「http://」の有無にかかわらず過去ツイートがヒットするよう期待している旨を伝えました。 その後しばらく様子を見ましたが 2月 19日時点で検索結果に特に変化は見られません。上のフォームに個別の返信はされない旨が掲載されていることもあり前述のとおりこの件は当面観察を続けるつもりです。一連の話題について事情をご存知の方はぜひコメントをお寄せ下さい。
(tanabe)
klab_gijutsu2 at 17:16│Comments(0)TrackBack(0)SNS 

トラックバックURL

この記事にコメントする

名前:
URL:
  情報を記憶: 評価: 顔   
 
 
 
Blog内検索
Archives
このブログについて
DSASとは、KLab が構築し運用しているコンテンツサービス用のLinuxベースのインフラです。現在5ヶ所のデータセンタにて構築し、運用していますが、我々はDSASをより使いやすく、より安全に、そしてより省力で運用できることを目指して、日々改良に勤しんでいます。
このブログでは、そんな DSAS で使っている技術の紹介や、実験してみた結果の報告、トラブルに巻き込まれた時の経験談など、広く深く、色々な話題を織りまぜて紹介していきたいと思います。
最新コメント