書籍
タンパク質構造とトポロジー (2013)
日本語で書かれたパーシステントホモロジーの教科書はこれだけだと思います。単体複体の定義、ホモロジーの定義、パーシステントホモロジーの定義と進んで行きます。代数トポロジーを既に知っている人はあっという間に読めてしまうかもしれません。
論文
Computing Persistent Homology (2005)
体上のパーシステントホモロジーを計算するアルゴリズムを解説しています。基底の取り替え、つまり行列の基本変形によって計算が簡単になることを使ってアルゴリズムを導出しています。
Persistence-Based Clustering in Riemannian Manifolds (2009)
パーシステントホモロジーを使ったクラスタリングアルゴリズムが紹介されています。当ブログでも以下の2つの記事でこの論文を取り上げました。
論文の内容は結構重いです。多様体上でハウスドルフ測度ベースの確率分布を考えています。クラスタを確率密度関数のピークと捉えることで、superlevel set によるパーシステントホモロジーでクラスタを数えています。
Proximity of Persistence Modules and their Diagrams (2009)
上の論文でも引用されている論文です。パーシステント図の安定性について述べています。
パーシステント図は一般に加群の列があれば定義できます。点を太らせていくパーシステントホモロジーも、ホモロジー群の列を経由してパーシステント図を導いていますからね。この加群の列を persistence module と呼び、パーシステント図同士には bottleneck dictance という距離を導入します。persistence module が似通っていれば、bottleneck distance も小さいことを証明しています。
Statistical Topological Data Analysis using Persistence Landscapes (2015)
パーシステントホモロジーを要約するものはパーシステント図とバーコードが有名ですが、ここでは persistence landscape というものを定義しています。パーシステント図やバーコードと異なるのは、persistence landscape は Banach空間に住んでいる点です。したがって2つの landscape の平均などを考えることができます。
Topological Data Analysis of Financial Time Series: Landscapes of Crashes (2017)
上の論文で紹介されている persistence landscape が時系列データの解析に有用であることを述べています。ここではアメリカ株式市場の4つの主要な指標を集めたデータに対して persistence landscape のノルムを計算し、ITバブルの崩壊とリーマンショックの手前でノルムの値が上昇することが示されています。
Topological Machine Learning with Persistence Indicator Functions (2019)
パーシステントホモロジーを要約する persistence indicator function というものを定義しています。単にバーコードの本数を数えるだけの関数ですが、仮説検定や k-SVM、k-PCA に応用できることが述べられています。
TopoLines: Topological Smoothing for Line Charts (2019)
パーシステントホモロジーを使って折れ線グラフを smoothing する方法が紹介されています。パーシステントホモロジーはデータのノイズを除去するのが得意なので、適材適所という感じですね。
Persistence weighted Gaussian kernel for topological data analysis (2016)
パーシステント図に対してカーネル法を用いる方法が述べられています。
kernel mean embedding を使ってパーシステント図全体の集合からヒルベルト空間への写像を作ります。ガウスカーネル等の性質のいいカーネルの場合これは単射となるため、情報を損失させずにヒルベルト空間内で議論ができます。ノイズをどれくらい取り込むかを制御するパラメータがあることや、グラム行列を近似する方法があることが利点です。
Persistence imgs: A Stable Vector Representation of Persistent Homology (2015)
パーシステントホモロジーを要約する Persistent imgs というものを定義しています。Persistent img はベクトルなので、各種の機械学習アルゴリズムに適用することができることが強みです。また Persistent Diagram や Persistent Landscape よりも計算コストがかからず、(論文で考察している k-medoids 法においては) これらよりも分類性能が高いことが述べられています。
ソフトウェア
Homcloud
パーシステントホモロジーを計算してくれるツールです。最初に挙げた書籍の著者である平岡先生の研究室で開発されました。