DB

目的は何か?

いろんなDWHやDBがあるが、
何を使うかは、

「要件をよく熟知して、
どのようなデータ構造かを理解してから」


にしましょう。
でないとあとで大変なことになります。
パッケージに合わせる方法もありますが、
そのパッケージでは完全にマッチしない場合が
あったりするので、
よーーーーく考えることです。

そしてかならず比較検討すること。
何に比べて、どれくらい早いとか。

当たり前のことなんだけど、
以外にできてないことが多い。
もりぞー 17:55 | コメント(0) | トラックバック(0) | DB

GreenPlumインストール

わけあってインストールすることになりました。
いろいろなサイトを参考にしました。感謝。
http://d.hatena.ne.jp/ilovegpdb/20110803/1312379459

ログを残します。


@GreenPlumインストールログ

//まずはrootで。
//バイナリデータを落としてくる。
http://www.greenplum.com/products/greenplum-database
で登録するとメールでバイナリのURLが送られてくる。
greenplum-db-4.2.2.4-build-1-CE-RHEL5-i386.zip

//解凍
unzip greenplum-db-4.2.2.4-build-1-CE-RHEL5-i386.zip

//インストール
./greenplum-db-4.2.2.4-build-1-CE-RHEL5-i386.bin

//ユーザー追加
useradd gpadmin

//ユーザー変更
su - gpadmin

//.bashrc に追加
vi .bashrc
~~
PATH=$PATH:$HOME/bin

export PATH
source /usr/local/greenplum-db/greenplum_path.sh
~~

//一度exit
//再度su gpadmin

//sshキー作成
ssh-keygen -t rsa
cd .ssh
cat id_rsa.pub >> authorized_keys
//テスト 接続できればok
ssh localhost

//設定ファイルコピー
cd
cp /usr/local/greenplum-db/docs/cli_help/gpconfigs/gpinitsystem_singlenode ~/
vi gpinitsystem_singlenode

~~
declare -a DATA_DIRECTORY=(/gpdata1 /gpdata2)
→declare -a DATA_DIRECTORY=(/data/segments /data/segments)
MASTER_DIRECTORY=/gpmaster
→MASTER_DIRECTORY=/data/master
MASTER_HOSTNAME=hostname_of_machine
→MASTER_HOSTNAME=test01
(ホスト名:便宜的にtest01としている)
~~
//exitでrootに
vi /etc/hosts
192.168.10.13 test01
(eth0に設定されているIPとなんらかのホスト名:便宜的にtest01としている)

hostname test01

//ディレクトリ作成・権限付与
mkdir /data/
mkdir /data/master /data/segments
chown gpadmin.gpadmin /data -R

//ファイル作成
su - gpadmin
vi single_hostlist
~~
test01
~~

//ファイル作成
echo 'localhost' > hostfile_exkeys
echo 'test01' > hostlist_singlenode

//キー生成
gpssh-exkeys -f hostfile_exkeys

//初期化
gpinitsystem -c gpinitsystem_singlenode

~~~~終わり~~~~~~~~~~~~~~~~~~~~


//スタート
gpstart -d /data/master/gpsne-1

//ストップ
gpstop -d /data/master/gpsne-1

//設定変更
vi /data/master/gpsne-1/postgresql.conf
もりぞー 13:45 | コメント(0) | トラックバック(0) | DB

DWHって早いの?

なんか最近騒がれてるDWH。
いろんなパッケージがあるけど、
ロー型じゃなくてカラム型が速いから~って
ふれこみで売られてる。
で?
で?
実際普通のよくあるRDBとくらべてどれくらい
速いの?っていうデータシートが何故か
見つからない。
(ウチの検索能力も問題か?)

GreenPlum(PostgreSQLの亜種)というDWHがあり、
結構ネットにのっているのだが、
いいことばかり書いてあるんだが、
実際どんなデータ構造でどんなSQLのとき
既存にくらべてどれくらい速い?みたいなのは
載ってないんだよねー。
開発元はEMC(元はGreenPlum社から買収?)で
日本の代理店が売ってたりするんだけど、
全然データがでてこない。
どうよ?って聞くと、
とりあえず現在のDB(テーブル構成)を構築して
SQL投げてみますね!っていう解答・・・。
(´Д`)・・・・
なんか微妙ですよね・・・。
はえーはえー言うなら、
例えばOracleに比べて!!とか
そ~いうデータがほしいわ。めっちゃ。
もりぞー 10:30 | コメント(0) | トラックバック(0) | DB

SunがMysqlを買収

朝から驚きニュースが・・

・米Sun、オープンソースDBのMySQLを買収へ (Impress)
http://enterprise.watch.impress.co.jp/cda/foreign/2008/01/17/12031.html

Javaのように明確なメリットがあるわけでなく、
オープンソースに貢献する的なコメントですが、
どうなんか・・・・。
どういう戦略だかいまひとつ見えません。
DB製品がほしかったというのはあると思いますが、
買収までいくとは・・。これからのSunのMysqlを
バンドル(サポート)した製品(ソリューション)に
期待します。
もりぞー 11:14 | コメント(0) | トラックバック(0) | DB
最近の記事
Admageという名…
02/13 14:36
(続)2月から広告が…
02/13 12:15
(続)2月から広告が…
02/10 17:29
2月から広告が表示さ…
02/07 18:46
(続)Cent5.x…
01/31 14:59
(続)Cent5.x…
01/29 18:01
Cent5.xでGl…
01/29 17:19
勉強会
08/13 18:44
Class A
07/29 20:50
8.8.8.8
06/25 15:19
マイナーな技術
06/25 14:36
工数見積
06/20 14:06
次世代機のCPU
06/19 13:04
Surface Pr…
06/17 09:44
Nexus10(続き…
06/17 09:33
最近のコメント
最近のトラックバック
Yahoo!ボットチェッカー
Googleボットチェッカー
MSNボットチェッカー

ディマージシェア技術ブログ