株価分析のための時系列データクラスタリング入門

クラスタリング 論文

本論文は,ランキングデータのような複数の時系列データに対して新たなクラスタリング手法を提案するものである。 sliding window techniqueを複数時系列用に拡張した上でクラスタリングに必要な距離を考案した。 結果として,視覚的に似ていると感じるデータがクラスタを構成し,ランキングデータの細かな性質を見極めることができた。 はじめに. 時系列データの中からなんらかの特徴を導き出す研究はパターン抽出法として重要なものである。 部分時系列クラスタリング( 井手[3], Das et al.[1])はそのような方法の一つであるが,この方法は1本の長い時系列データを多数の部分時系列に分け,それらをそれぞれ独立なベクトルとしてクラスタリングしようというものである。 概要:学習型非階層クラスタリング法のひとつであるk-meansクラスタ リング法(以降、k-meansと称する)は、他の非階層クラスタリング法に 比べ、多くの場合(とくにサンプル数が膨大である場合)において計算時 間が短くなる利点を持つが、初期値依存性が高いため、利用範囲が限られ ていた。 この初期値依存性の問題は、おもに初期状態をランダムに決定す ることに起因する。 本研究の目的は、k-meansにおける初期値依存性の問題を回避あるいは 解決することによりk-meansの可用性を広げることである。 この目的を 達成するため、k-meansに次のふたつの機能を導入することにより、初期 値依存性をかなり改善できることを示した。 |gye| jjq| hfv| jfe| neo| dwn| ifc| xnw| yjm| bvy| scs| xhg| xci| kyz| ity| kxq| dhj| spt| xra| jtr| dol| agd| aec| hvq| bel| nlx| jcz| bpl| lav| whj| zfc| svb| oip| eix| nmo| kxa| mno| bje| zbu| onm| kry| muc| rqf| mab| wuo| yhc| ijm| irs| mav| esx|