import pandas as pd
abalone_df = pd.read_csv("abalone.csv")
abalone_df.head()
#カウント、平均値、標準偏差、最小値、四分位点、最大値
abalone_df.describe()
#性別ごとのカウント
count=abalone_df['Sex'].value_counts()
count_df=pd.DataFrame(count)
print(count_df)
import matplotlib.pyplot as plt
%matplotlib inline
count_df.plot.bar(y=['Sex'])
#散布図行列
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
sns.set()
sns.pairplot(abalone_df)
#相関係数
corr = abalone_df.corr()
corr
#Heightが0.4以上の観測値を除外
abalone2_df = abalone_df[abalone_df.Height<0.4]
print(len(abalone2_df))
abalone2_df.head()
#散布図行列
sns.pairplot(abalone2_df)