Skip to content

DB比較実験条件

toshihisa edited this page Aug 26, 2014 · 2 revisions

実行環境

  • CPU:Quad-Core AMD Opteron(tm) Processor 2376 8core
  • メモリ:16G

データ

100万件データ

以下のようなwikipediaからとった実データ

ID title titleの長さ 本文の長さ カテゴリー数 ダミーのスコア(タイトルの長さをカテゴリ数で割ったもの
1       Anarchism       9       114476  5       1.800000
2       Autism  6       106801  6       1.000000
3       Albedo  6       20714   5       1.200000
4       A       1       7740    2       0.500000
5       Alabama 7       88637   7       1.000000
6       Achilles        8       35604   7       1.142857
:
:

1000万件データ

100万件データを元に加工して件数を増やしたデータ

:
:
999991  Avalon (New Windsor, Maryland)  30      1101    2       15.000000
999992  Orlando Luis Garcia     19      1294    6       3.166667
999993  Gildemeister AG 15      2541    3       5.000000
999994  ABA Business Center     19      612     1       19.000000
999995  Freewire        8       3623    3       2.666667
999996  CityMax 7       6660    2       3.500000
999997  Affinity (Bill Evans album)     27      1957    2       13.500000
999998  Nightingale Primary School      26      1410    1       26.000000
999999  Flamenco (1952 film)    20      957     5       4.000000
1000000 Eleanor Norrie  14      903     3       4.666667

各DBの利用方法

groonga

  • コマンドインタプリタとして利用(groonga DB < query)

grnxx(dummy11)

  • コマンドインタプリタとして利用(cat query | grnxx)
  • クエリ形式は独自形式

grnxx(dummy13)

  • C++ ライブラリとして利用
  • クエリ形式は未定

sphinx

  • サーバとして利用
  • realtime index モードで利用
  • クエリはsql クライアントで実行
  • クエリ形式は擬似SQL

solr

  • サーバとして利用
  • クエリはcurlで実行
  • クエリ形式は独自形式

VoltDB

  • サーバとして利用
  • クエリは付属クライントプログラムを利用
  • クエリ形式はSQL