Pythonデータ分析-関数の適用

大量のデータを分析するプロセスでは、テキストベースのデータを数値データに処理する必要がある場合があります。これは、モデルに入れて使用するのに便利です。

変数の悲惨化など、セグメント内の数値データを処理する必要がある場合もあります。そして、これらの操作は、pythonのapply関数で処理できます。

今日は、データ分析の4番目のレッスンを紹介し、Pythonでapply関数を使用して、データフレームに対してより複雑な操作を実行する方法を説明します。

この記事の内容

  1. 文字データを数値データに処理する
  2. 数値データのフラグメント処理

注:この記事では、データ分析の最初のレッスンでデータフレームdate_frameを使用します[[Pythonデータ分析-データ作成](http://mp.weixin.qq.com/s?__biz=MzIxMjA1NzQzMQ==&mid=2247485128&idx=1&sn=64a6f87a16fa3cd41dadfcfea2f76787&chksm=974aaaf0a03d23e69179350c6fd900a2ba12d34c0a82426654fb76b5315e0936251d307375f1&scene=21#wechat_redirect)]:

** 1 文字データを数値データに処理する**

元のデータフレームの性別列を置き換え、「男性」文字を1に置き換え、「女性」文字を0に置き換えて、新しい列を生成するとします。

まず、置換機能をカスタマイズできます。具体的な説明は次のとおりです。

def replace_gender_to_num(val):if val=='男性':return1else:return0

次に、apply関数を使用して関数を呼び出します。具体的なステートメントは、次のとおりです。

date_frame.gender.apply(replace_gender_to_num)

結果は次のとおりです。

これまでのところ、元の性別列の「男性」文字は1に置き換えられ、「女性」文字は0に置き換えられています。

元のデータフレームに列を追加します。具体的なステートメントは次のとおりです。

date_frame['new_gender']= date_frame.gender.apply(replace_gender_to_num)

結果は次のとおりです。

性別が男性であり、対応する値がnew_genderで1であり、性別が女性であり、対応する値がnew_genderで0であることがわかります。

** 2 セグメント内の数値データを処理する**

モデリングプロセスでは、さまざまなセグメントの値を対応する問題に変換するには、処理に適用機能を使用する必要があります。

同様に、この例では、身長が1.8を超える生徒を最初のカテゴリ、身長が1.65を超える生徒を2番目のカテゴリ、残りの生徒を3番目のカテゴリと見なします。

変換関数は次のように定義できます。

def height_to_class(val):if val>=1.8:return1
 elif val>=1.65:return2else:return3

次に、apply関数を使用して関数を呼び出し、結果値を元のデータフレームに保存します。具体的なステートメントは次のとおりです。

date_frame['heigth_class']= date_frame.height.apply(height_to_class)

結果は次のとおりです。

これまでに、データ処理のためのpythonでのapply関数のアプリケーションが導入されました。それを練習して、apply関数に他の用途があるかどうかを考えることができます。

Recommended Posts

Pythonデータ分析-関数の適用
02.Pythonデータタイプ
Pythonデータモデル
Pythonデータ分析
Python enumerate()関数
pythonデータ構造
Pythonデータ形式-CSV
Python関数バッファー
Pythonカスタム関数の基本
Pythonの結合関数
Python組み込み関数-compile()
Pythonデータ分析-データ更新
Python3組み込み関数table.md
Pythonデータ分析-データ選択
Pythonの基本的なデータタイプ
Pythonの基本的なデータタイプ
Pythonプリントプリントタイマー機能
Pythonデータ分析-データ確立
Pythonは関数メソッドを定義します
Pythonの上位関数の使用法の概要!
Pythonはオンライン翻訳機能を実現します
Pythonデータサイエンス:ニューラルネットワーク
Pythonの一般的なデータ構造の照合
Python3クローラーデータクリーニング分析
Pythonは単純なXMLデータを解析します
Pythonデータサイエンス:ロジスティック回帰
Pythonトルネードアップロードファイル機能
Pythonのデータ構造とアルゴリズム
Pythonマジック関数eval()学習
PythonがFTP機能を実装する方法
Pythonデータサイエンス:正規化方法
Pythonデータサイエンス:関連分析
Pythonデータサイエンス:線形回帰
PythonFakerデータ偽造モジュール
Pythonは画像スティッチング機能を実装しています
Pythonの上位関数の使用法の概要!
Pythonデータサイエンス:Chi-Square Test
Pythontelnetログイン関数の実装コード
Python |再帰を使用して解決する関数
Pythonデータサイエンス:線形回帰診断
Pythonがメール機能を実装する方法
Pythonが関数のオーバーロードをサポートしないのはなぜですか?
pythonに関数のオーバーロードはありますか
Pythonの3日目の1行関数の学習
Python関数の定義とパラメーターの説明
PythonATM関数の実装コード例
PythonはAIフェイスチェンジ機能を実装しています
Pythonはオンラインマイクロブログデータの視覚化を実現します
Pythonは画像認識カー機能を実現
pythonはデータマイニングに適していますか
Pythonはftpファイル転送機能を実装しています
Pythonはudp送信画像機能を実現します
Pythonがタイマー機能を実装する方法
Pythonでデータ分析レポートを自動的に生成する
npy形式のデータ例へのPythonアクセス
pythonでid関数を実行する方法
pythonのid関数は何ですか
Pythonの匿名関数とは何ですか
pythonはどのように独自の関数を呼び出すのですか
ビッグデータ分析用のJavaまたはPython
python3はマスク描画の機能を実現します