インターネットの急速な発展により、ますます多くのデータと情報がインターネットに保存されています。これらのデータを分析することで、大手企業は意思決定に役立つ情報を得ることができます。
たとえば、一部のユーザーのタオバオ閲覧記録データを分析することで、これらの顧客の潜在的な消費ポイントを発見し、分類によって指定されたポイントに広告を掲載して、商品の売上を増やすことができます。
もう1つの例はクレジットフィールドです。申請者のクレジットデータを分析し、申請者が延滞する可能性をモデル化して計算することにより、貸与するかどうかを決定し、それによって会社の資金の使用価値を高めます。
今日、データ分析がますます普及しているとき、データを分析することを学ぶことはあなたの昇進と給料の増加のための重要な重みです。
本日より、この公式アカウントでは、データ分析とモデリングに関する一連の無料チュートリアルを公開します。誰もがすぐにデータ分析を開始し、pythonの魅力を理解できるようにします。
この記事は、データ分析の最初のレッスンであり、Pythonでデータフレームを手動で構築する方法を説明します。これは、データ分析の基礎であり、データテストに一般的に使用されるツールです。
この記事の内容
パッケージのインポート
構築するデータフレーム
上記のデータフレームを構築するためのPythonコード
印刷結果を出力
** 1 パッケージのインポート**
pythonをインストールしていない学生は、オンラインチュートリアルに従ってpythonをインストールしてください。ちなみに、多くのライブラリがインストールされるように、anacondaをインストールすることをお勧めします。
# coding:utf-8 #コーディングフォーマットを確認し、中国語を使用する
import pandas as pd #パッケージをインポートし、このパッケージにエイリアスpdを付けます
from pandas import DataFrame #パンダにDataFrameクラスをインポートします
まず、パンダパッケージをjupyterにインポートします。作成するデータフレームには中国語が含まれているため、コードの先頭にutf-8としてのコーディング宣言が追加されています。
** 2 構築するデータフレーム**
pythonで手動で確立するデータ形式は次のとおりです。
各行は学生を表し、列は次のように表されます。IDは学生番号、名前は名前、性別は性別、年齢は年齢、高さは身長を表します。
** 3 上記のデータフレームを構築するためのPythonコード**
上記の表をPythonの辞書で表現し、pd.DataFrame関数を使用して辞書をデータフレームに変換します。
date ={'ID':['1000001','1000002','1000003','1000004','1000005','1000006','1000007','1000008'],'name':['Lu Yifan','ドニーナ','周英慧','ゾウカイキ','張ゼクン','李嘉民','Ling Zizhou','趙純気'],'gender':['男性性性性','女性性性性','女性性性性','女性性性性','男性性性性','女性性性性','男性性性性','男性性性性'],'age':[17,18,20,19,18,16,17,18],'hegth':[1.78,1.68,1.62,1.73,175,160,1.82,180]}
date_frame = pd.DataFrame(date)
** 4 作成したデータフレームを印刷します**
次の結果を得るには、jupyterにdata_frameキーワードを入力します。
この時点で、pythonでデータフレームを手動で作成するタスクは完了しています。このチュートリアルに従って、自分に属するデータフレームを作成してください。
Recommended Posts