静かなる名辞

pythonとプログラミングのこと



pandas

【python】pandasのgroupbyで結果をlistにする

pandasのgroupbyを使って、平均や標準偏差を計算する方法は検索するとすぐ出てきます。 ただ、「そういうの良いから、項目ごとに使いやすいイテレータにしてまとめてくれよ!」と思うときがありますよね。 >>> import pandas as pd >>> df = pd.DataFrame({"…

【python】sklearnのVarianceThresholdを試してみる

はじめに VarianceThresholdは名前の通り、分散がしきい値以下の特徴量を捨てます。sklearn.feature_selection.VarianceThreshold — scikit-learn 0.20.0 documentation これといってすごいところはありませんが、気楽に使えそうなので試してみました。 目次…

【python】pandasのDataFrameをLaTeX出力

そんな機能があるらしい。DataFrame.to_latex()です。pandas.DataFrame.to_latex — pandas 0.21.1 documentation これが使えると何かの役に立つかもしれないので、使い物になるかどうか確認してみる。 お試し とりあえず、てきとーにdfを作ってみる。中身に…

【python】pandasでデータを標準得点(z得点)に変換

データの正規化(標準化)をpandasでもやってみる。 正規化、標準化とは、データを分散1、平均0に変換する操作である。自分で書いてもできるが、scipyの関数を使うと簡単にできる。 >>> import pandas as pd >>> df = pd.DataFrame([[1,2,3,4,5,6], [6,5,4,3…

【python】pandasでdfの平均と標準偏差を計算する方法

DataFrameから平均と標準偏差を計算する方法をメモしておきます。 目次 列の平均と標準偏差を計算したい 行の平均と標準偏差を計算したい 列の平均と標準偏差を計算したい 超簡単。 >>> import pandas as pd >>> df = pd.DataFrame([[1,2,3,4,5,6], [6,5,4,3…

【python】クラスタリング結果を積み上げ棒グラフで可視化する

ラベル付きデータをクラスタリングすることがよくあります(そんな頻繁にあるか? まあ、クラスタリングの使い方次第でたまにはあるからこうして記事にしている訳ですが)。 各クラスタの中身がどんなラベルで構成されているのか、知りたくなります。積み上…