Pythonは短いです-スピリットケージは何と言っていますか

スピリットケージの弾幕は何と言っていますか#

概要##

そもそも「LingCage」のアートペインティングが制作され、B局限定で放送されました。全国漫画での制作は素晴らしいですが、プロットに欠陥が多すぎます。コメントは二極化しており、良いものは非常に良いと言い、悪いものは非常に悪いと言っています。弾幕が言うことを見る

アイデア

  1. クローラーを介したクロール弾幕
  2. 弾幕をセグメント化するためにjieba単語セグメンテーションを使用する
  3. wordcloudを介してwordcloudを描画します

使用したライブラリ

コードのアイデアは、ステーションBのPython学習者からのものです

コード##

# クロールデータ
import csv
# データリクエストライブラリ
import requests
# 正規表現
import re
# 分詞
import jieba
# ワードクラウド
import wordcloud

# 1. 場所のURL
url='https://api.bilibili.com/x/v2/dm/history?type=1&oid=129528808&date=2020-08-28'

# 2. シミュレートされたログイン
# ピッキング防止の傍受を防ぐためにhリクエストヘッダーを設定します
# ステーションbはログイン後に弾丸画面を表示するため、ここに独自のコンピューターCookieを追加する必要があります
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0',"Cookie":"_uuid=445F64D3-1530-41CF-09EC-C6029EF29EA659147infoc; buvid3=54281361-1A51-46A7-838B-7FB1214C81B953936infoc; CURRENT_FNVAL=16; LIVE_BUVID=AUTO9915845422486102; rpdid=|(u)~mYY~u0J'ul)RlRkkR); sid=4y1wx1oi; DedeUserID=229593267; DedeUserID__ckMd5=72ee797eb51fb8c3; SESSDATA=b7620543%2C1600240037%2Cd737d*31; bili_jct=03269466eb702a213723a0585db59cbe; bp_t_offset_229593267=428995725967649604; CURRENT_QUALITY=80; PVID=1; _ga=GA1.2.1605929815.1586006097; bp_video_offset_229593267=428995725967649604; blackside_state=1; bfe_id=fdfaf33a01b88dd4692ca80f00c2de7f"}
# データをリクエストする
resp = requests.get(url,headers=headers)
# コードの文字化けを防ぐためにデータをデコードする
html=resp.content.decode('utf-8')
# 3. Webページを解析してサブタイトルを抽出します
# 通常の式を使用して、返されたhtmlの弾幕を抽出します
res=re.compile('<d.*?>(.*?)</d>')
danmu=re.findall(res,html)

# 4. データを保存する
for i in danmu:withopen(r'D:\360MoveData\Users\cmusunqi\Documents\GitHub\R_and_python\python\ワードクラウドとクローラー\弾幕.csv','a',newline='',encoding='utf-8')as f:
  writer=csv.writer(f)
  danmu=[]
  danmu.append(i)
  writer.writerow(danmu)

# ワードクラウド描画============================================================
# 保存したcsvファイルを読む
f =open(r'D:\360MoveData\Users\cmusunqi\Documents\GitHub\R_and_python\python\ワードクラウドとクローラー\弾幕.csv',encoding='utf-8')
txt=f.read()
# jieba参加者
txt_list=jieba.lcut(txt)
# 単語分割後のリストをスペースで接続する
string=' '.join(txt_list)
# ワードクラウドを描画するには、組み込みパラメータの公式コードを確認してください
w=wordcloud.WordCloud(
 width=1000,
 height=700,
 background_color='white',
 font_path="msyh.ttc",
 scale=15,
 stopwords={" "},
 contour_width=5,
 contour_color='red')
# 画像をpngとしてエクスポート
w.generate(string)
w.to_file(r'D:\360MoveData\Users\cmusunqi\Documents\GitHub\R_and_python\python\ワードクラウドとクローラー\ciyun.png')

結果##

描かれたワードクラウドの最大の言葉は、恐れと不意を突かれることです。恐れている場合は、PYoを見てください。

結びの言葉##

love&peace

Recommended Posts

Pythonは短いです-スピリットケージは何と言っていますか
pythonはモジュールのインストールが完了したとどのように判断しますか
pythonはどのように環境を変えますか
Pythonの用途は何ですか
pythonはどのように計算速度を向上させますか
python変数の範囲は何ですか
pythonのid関数は何ですか
python3のピップパスはどこにありますか
Pythonはjsonモジュールをどのように処理しますか
python開発の見通しは何ですか
pythonの関数本体は何ですか
pythonインストール後のディレクトリはどこにありますか
pythonでのadbの機能は何ですか
pythonのタブキーはどういう意味ですか
Pythonに付属しているIDEはどこにありますか
pythonとpycharmの違いは何ですか
2.1 Pythonインタープリター(pythonインタープリター)
同期Pythonと非同期Pythonの違いは何ですか?
エンタープライズ言語に対するpythonの利点は何ですか
pythonファイルが書かれた後に練習する方法
pythonはどのように辞書のキーを呼び出しますか
pythonはどのようにしてキーボードから入力例を取得しますか
pythonはプログラムをどのように処理しますか開くことができません