けむブログ

データ分析に関する気付きや学びを記録するブログ

2018-05-01から1ヶ月間の記事一覧

pandas ilocで隣り合わない複数列を取得する方法

やりたいこと python pandas のDataFrameで、隣り合わせでない、飛んだ列を取得する df = pd.DataFrame( data=[[10, 5, 3, 1],[2, 4, 5, 2], [1, 3, 4, 2],[1, 5, 3, 4], [7, 6, 5, 4]]) たとえばこのdataframeの場合で1列目と、3列目~4列目のデータを取り出…

2018/05/29 記事メモ

データ分析の記事 data.gunosy.io ユーザーの特定の行動をする確率の分布の密度比を利用して異常検知を置こうなう 前提として分布には規則性があり、バグがあれば歪む 密度比:TBD マーケの記事 US版メルカリのミッションは「モノを売ろうと思ったらメルカリ…

2018/05/28 記事のメモ

データ活用事例の記事 Tokyo Editors Labに参加してきました - Gunosyデータ分析ブログ ニュースのテーマ×年代性別の分析 目的:ユーザーの興味のある情報しか集まらない世界を脱するために、「ユーザーに対して幅広いニュースを読む事ができる環境・仕組み…