PythonのNumPyのndarrayで各列の合計と平均と各行の相関を計算する
$ cat data.csv 8,9,6,2,9,3,8,4,1,9 5,5,4,2,6,3,5,2,2,6 2,2,5,5,2,5,4,4,7,4
import numpy as np data = np.loadtxt('data.csv', delimiter=',') print(data) print(type(data)) print('列の合計', np.sum(data, axis=0)) print('列の平均', np.mean(data, axis=0)) print('1行目と2行目の相関', np.corrcoef(data[0], data[1])[0][1]) print('1行目と3行目の相関', np.corrcoef(data[0], data[2])[0][1]) print('2行目と3行目の相関', np.corrcoef(data[1], data[2])[0][1])
結果
[[8. 9. 6. 2. 9. 3. 8. 4. 1. 9.] [5. 5. 4. 2. 6. 3. 5. 2. 2. 6.] [2. 2. 5. 5. 2. 5. 4. 4. 7. 4.]] <class 'numpy.ndarray'> 列の合計 [15. 16. 15. 9. 17. 11. 17. 10. 10. 19.] 列の平均 [5. 5.33333333 5. 3. 5.66666667 3.66666667 5.66666667 3.33333333 3.33333333 6.33333333] 1行目と2行目の相関 0.9525684104975952 1行目と3行目の相関 -0.8226727181570143 2行目と3行目の相関 -0.7083333333333333