Pythonデータ分析
うまくやりたいのなら、まずツールを研ぎ澄ます必要があります。」Pythonは、データ分析に最も一般的に使用されているプログラミング言語です。私たちは巨人の肩に立ち、効率的にデータ分析を完了することができます。
まず、Pythonの開発の歴史を理解しましょう。Python言語は1980年代に誕生しました。オランダ人のGuidovanRossumによって開発されました。 Guido vanRossumをPythonの父と呼びます。 Pythonという名前の由来について言及する価値があります。Pythonはpythonを意味しますが、Guidoの名前はpythonとは何の関係もありません。 GuidoがPythonを実装していたとき、彼は1970年代のBBCコメディーからのMontyPythonのFlyingCircusのスクリプトも読みました。 Guidoは、短くてユニークで少し不思議な名前が必要だと考えたので、言語をPythonと呼ぶことにしました。
Python 1.0バージョンは1994年1月にリリースされました。このバージョンの主な新機能はラムダ、マップ、フィルター、リデュースですが、Guidoはこのバージョンを好みません。
6年半後の2000年10月にPython2.0がリリースされました。このバージョンの主な新機能は、メモリ管理とサイクル検出ガベージコレクターおよびUnicodeのサポートです。ただし、最も重要な変更は開発プロセスの変更であり、Pythonのコミュニティはより透過的になりました。
2008 その年の12月に、Python3.0がリリースされました。 Python3.xはPython2.xと下位互換性がありません。つまり、Python3.xはPython2.xコードを実行できない可能性があります。 Python3は、Python言語の未来を表しています。
今日のPythonは3,0の時代に入り、Pythonコミュニティも活況を呈しています。関連するPythonの問題を尋ねると、ほとんどの場合、誰かが同じ問題に遭遇し、すでに解決しています。
Python言語の機能:
Pythonは完全にオブジェクト指向の言語です。関数、モジュール、数値、文字列はすべてオブジェクトです。Pythonでは、すべてがオブジェクトです。オーバーロードされた演算子をサポートし、一般的な設計もサポートします。
Pythonには強力な標準ライブラリがあります。Python言語のコアには、数値、文字列、リスト、辞書、ファイルなどの一般的なタイプと関数のみが含まれています。Python標準ライブラリは、システム管理、ネットワーク通信、テキスト処理、データベースインターフェイス、グラフィックスを提供します。システム、XML処理およびその他の追加機能。
Pythonコミュニティは、標準ライブラリと同様の方法で使用される多数のサードパーティモジュールを提供しています。それらの機能は、科学コンピューティング、人工知能、機械学習、Web開発、データベースインターフェイス、およびグラフィックシステムをカバーしています。
Pythonには強力な機能があるため、使いやすく、使い始めるのも簡単です。 「人生は短い、私はPythonを使っている」とよく言われます。研究機関のTiobeは今週、2020年10月の分析レポートを発表し、Python言語は2年連続で3位にランクされました。 2020年11月の最新データでは、PythonはJavaを上回り、止められない傾向で2位になりました。
適切なプログラミング言語を選択することは特に重要です。Python言語はシンプルで、習得が容易で、高速で、無料でオープンソースです。問題を解決する方法、無料でオープンなコミュニティ環境、豊富なサードパーティライブラリに重点を置いています。車輪を作るのに時間を無駄にする必要はありません。 Webフレームワーク、クローラーフレームワーク、データ分析フレームワーク、機械学習フレームワークには、すぐに使用できるすべてのものがあります。 Pythonの人気の観点から、それは増加しています
ここでは、Pythonを使用してデータ分析を行います。主に、次の2つの側面から問題を検討します。
まず、どの開発ツールを選択するか。
第二に:データ分析の問題を解決するために学ぶべき知識。
開発ツールとしてアナコンダをお勧めします。特定のソフトウェアは、清華大学のオープンソースミラーWebサイト(https://mirror.tuna.tsinghua.edu.cn/help/anaconda/)からダウンロードし、使用しているコンピューターのソフトウェアおよびハードウェア環境に応じて、対応するバージョンのインストールパッケージをダウンロードできます。インストールが完了したら、コンソールにjupyternotebookと入力します。
この公式アカウントには、詳細なanacondaのインストールプロセスがあります。記事のリンクは次のとおりです。
アナコンダのインストールプロセス
ブラザーダビン、パブリックアカウント:データバレー[Pythonアナコンダインストール](http://mp.weixin.qq.com/s?__biz=MzUxMTAzOTkzMQ==&mid=2247484820&idx=2&sn=66db50025112ee7401a3fd8545ea2ca9&chksm=f9788540ce0f0c562938d717e4442f3890f9714273295723ed334a95ece8b9ade33fc7ea5d76#rd)
Pythonの知識ポイントと、データ分析で使用される一般的な科学コンピューティングライブラリも、すべての人にリストする必要があります。
基本構文:変数、データタイプ、条件、ループ。
データ構造:コレクション、タプル、辞書。
入出力
モジュール
クラス
科学コンピューティングライブラリ:NumPy、Pandas、Matplotlib、Seaborn。
Pythonデータ分析は、主にデータクリーニングと[データ視覚化](https://cloud.tencent.com/product/yuntu?from=10680)の問題を解決することです。データ分析機能を向上させるには、Pythonの基本的な文法規則を習得し、サードパーティのモジュールを呼び出すことが非常に重要です。 NumPyとPandasはデータクリーニングに最適なツールであり、MatplotlibとSeabornはデータ視覚化のためのツールキットです。実用的な観点からPythonを学び、データ分析の能力と効率を向上させることができます。
Recommended Posts