スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
【--/--/-- --:--】 | スポンサー広告 |このエントリーをはてなブックマークに追加
Lesson 1.5 検索語の並びについて(Word order matters) 前編
知ってるようで以外に知らなかった、検索語の入力方法について。
この回は、私的にかな―り目からうろこ。

ちょっと長いので前編・後編に分けました。

ストップワード相当の単語も入れると検索結果は変わる!


のっけから知らないテクニックだった…

文章中に頻出する短い言葉(a, an, theといった冠詞や not, andなどの短い単語)は
「ストップワード」といって、検索システムでは検索の対象にならないことが多いです。

これらの言葉を検索対象にすると、余計な情報を引っ張りすぎる(検索ノイズが増える)ためです。

ところが、この講義では

すごく短い言葉でも入れると検索結果が変わる


と解説されていました。

例として、「who」という単語を調べるときに、

 who とだけ入れる → 世界保健機関(WHO:World Health Organization)
 the who と入れる → ザ・フー(The Who)というバンド
 a who と入れる → Horton Hears a Who!という映画


に関する情報がそれぞれ検索結果の上位にヒットしました。

Googleのヘルプにも「ストップ語は無視します」とあるのに。。。

ストップ語

Googleでは頻繁に使われる言葉や文字をストップ語句といい、検索キーワードから自動的に除きます。 たとえば、"http" や ".com" のほか、特定の単一数字および単一文字を自動的に無視します。これらの言葉が検索を絞り込むことはまれであり、むしろ、検索の速度を大幅に低下する原因となりうるためです。

検索にストップ語を含めるには半角 "+" 符号を使用します。"+" の前には必ずスペースを挿入して下さい。

Google 基本検索より



「冠詞(やストップワード)+ 単語」で、一般に知られる単語となっている項目は
Google先生も、単語単体の場合とは区別した結果を返してくれるみたい。
すごー。

ということで、

Google検索では、ストップワードがあっても省略しないで検索してみる!
のがいいのかも知れません。


検索について、良く知っている方ほど無意識に外して検索しているかも知れないのでチェックです!


大文字/小文字、ミススペルはあんまり気にしなくてOK!


ヘルプにもありますが、Googleでは大文字と小文字の区別は行わないそう。

そのため、
 Who
 wHo
 who
などなど、どれでも一緒の答えが返ってきます。


※ただし「OR」は別。
大文字でORと書くと、論理和(AまたはB)を検索するための演算子として判断されます。
(これはLesson 3.4 OR検索とフレーズ検索(OR and quotes)の講義で詳しく触れています)


あと、スペルミスもオートコンプリート機能などで補完できるため、神経質にならなくても大丈夫だそうです。

Google検索では、間違ったつづりで検索しても、自動的に正しいと思われるスペルを使って検索してくれます。
もちろん、入力したそのままの結果を出すことも可能です。


キーワードの順番を変えると検索結果も変わる!


これも知ってて損はない知識。

2個以上のキーワードをスペースで区切って検索(AND検索)する時に、
キーワードの並びによって、検索結果も変わる



例題(Google.com)では

sky blue → 科学的な「空が青い」に関するページ
blue sky → blue skyというスタジオ

が上位にヒットしました。

ちなみに日本のgoogle.co.jpで検索すると

sky blue → サントリーのウオツカ「skky blue
blue sky → JAL空港で買えるお土産「BLUE SKY

がそれぞれ上位にヒットしました。
これも面白いですね!

語順はバッチリこれ!間に余計な単語も要らない!って場合は
””で囲う「フレーズ検索」をおススメします。



後半に続きます♪
Lesson 1.5 検索語の並びについて(Word order matters)後編~認識する記号・しない記号~



おまけの自主練習


まだまだ他の例もみたい!
ってことで早速実践してみましたよ。

最近でたApple社のOS「mountain lion」と、入れ替えた「lion mountain」で
やってみましたが、あんまし変わらなかった。

なので、私がちょっと前にプレイ動画を見まくってたゾンビゲー、
”デットラ”こと「デットライジング」(カプコン)
というキーワードでチャレンジ!


※注意!
このゲームは、暴力的かつグロテスクな表現のあるゲームです。
(CEROレーティングマークはZ →当然18禁!)

以下の検索を実際に行うと、若干グロテスクな検索結果
(特に画像検索!)が出る可能性があります。
お嫌いな方は、ググらないようにしてください!

いい検索例がパッと見つからなくてすみません...


※google.co.jpでやると、結果にほとんど差が無かったのでgoogle.comで検索してます。

→ 理由はこちらを参照ください
英単語での検索はgoogle.comでやってみて!いろいろ捗るかも!


はじめに:デッドラってこんなゲーム


フリージャーナリストである主人公が、
街に発生した大量のゾンビの群れを様々な方法で撃退しながら、
事件の真相を突き止めていく新作のアクションゲーム
ジャンル:ゾンビパラダイスアクション
カプコンのプレスリリースより



dead rising(正しい順番で検索)


まずは正しい順番(正確にはDEADRISINGと続けて綴るようですが)

dead rising - Google Search

dead rising での検索


はい
1件目にデッドラについての英語版Wikipediaのページ。
2件目に米国のゲームポータルサイトIGNのゲームページ。
3件目にカプコンのヨーロッパ版オフィシャルサイト。

それからデッドラのゲーム画像... 
(画像はグロテスク表現アリなので実際の検索&閲覧は自己責任で。
特に海外版の同作品は残酷表現規制が日本よりも緩いのでご注意!)


rising dead(順番を入れ替えて検索)


お次、順番を変えると。。。

rising dead - Google Search


rising dead での検索


Rising Deadという映画やゲームがあったらしく、

1件目はIMDb(映画やTV番組のデータベース)の映画情報ページ
2件目はrising deadというゲームの情報サイト?(ちょっと良く分からない)

画像は、、、
これは初めの2ページくらいはデッドラの画像ばっかりですね。
若干デッドラ以外(rising dead関連?)の画像が含まれているのが
dead rising の順番で調べた時との違いかな。


確かにキーワードの並びで検索結果も変わってきますね。

でもやっぱりキーワード同士の関連性の強いものが上位に?!


ただし、上記の他、数例やってみた結果、語順によらず
「キーワード同士の結びつきが強い」ものが上位に来るようです。

上記の例だと
「dead」と「rising」というキーワードを組み合わせる場合は
「rising dead」という作品より、「dead rising」というゲームが
検索結果の上位に来やすいようです。(よく検索されるから?)

これは画像検索結果なんかだと特に顕著なようです。
【2012/07/30 19:49】 | 情報収集のコツ | トラックバック(0) | コメント(0) |このエントリーをはてなブックマークに追加
<<Lesson 1.5 検索語の並びについて(Word order matters)後編~認識する記号・しない記号~ | ホーム | Lesson 6.1 検索テクニックの組み合わせ(Combining methods)>>
コメント
コメントの投稿














管理者にだけ表示を許可する

トラックバック
トラックバックURL
→http://imuz.blog10.fc2.com/tb.php/369-33d15ad1
この記事にトラックバックする(FC2ブログユーザー)
| ホーム |
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。