そもそも「LingCage」のアートペインティングが制作され、B局限定で放送されました。全国漫画での制作は素晴らしいですが、プロットに欠陥が多すぎます。コメントは二極化しており、良いものは非常に良いと言い、悪いものは非常に悪いと言っています。弾幕が言うことを見る
アイデア
使用したライブラリ
コードのアイデアは、ステーションBのPython学習者からのものです
# クロールデータ
import csv
# データリクエストライブラリ
import requests
# 正規表現
import re
# 分詞
import jieba
# ワードクラウド
import wordcloud
# 1. 場所のURL
url='https://api.bilibili.com/x/v2/dm/history?type=1&oid=129528808&date=2020-08-28'
# 2. シミュレートされたログイン
# ピッキング防止の傍受を防ぐためにhリクエストヘッダーを設定します
# ステーションbはログイン後に弾丸画面を表示するため、ここに独自のコンピューターCookieを追加する必要があります
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0',"Cookie":"_uuid=445F64D3-1530-41CF-09EC-C6029EF29EA659147infoc; buvid3=54281361-1A51-46A7-838B-7FB1214C81B953936infoc; CURRENT_FNVAL=16; LIVE_BUVID=AUTO9915845422486102; rpdid=|(u)~mYY~u0J'ul)RlRkkR); sid=4y1wx1oi; DedeUserID=229593267; DedeUserID__ckMd5=72ee797eb51fb8c3; SESSDATA=b7620543%2C1600240037%2Cd737d*31; bili_jct=03269466eb702a213723a0585db59cbe; bp_t_offset_229593267=428995725967649604; CURRENT_QUALITY=80; PVID=1; _ga=GA1.2.1605929815.1586006097; bp_video_offset_229593267=428995725967649604; blackside_state=1; bfe_id=fdfaf33a01b88dd4692ca80f00c2de7f"}
# データをリクエストする
resp = requests.get(url,headers=headers)
# コードの文字化けを防ぐためにデータをデコードする
html=resp.content.decode('utf-8')
# 3. Webページを解析してサブタイトルを抽出します
# 通常の式を使用して、返されたhtmlの弾幕を抽出します
res=re.compile('<d.*?>(.*?)</d>')
danmu=re.findall(res,html)
# 4. データを保存する
for i in danmu:withopen(r'D:\360MoveData\Users\cmusunqi\Documents\GitHub\R_and_python\python\ワードクラウドとクローラー\弾幕.csv','a',newline='',encoding='utf-8')as f:
writer=csv.writer(f)
danmu=[]
danmu.append(i)
writer.writerow(danmu)
# ワードクラウド描画============================================================
# 保存したcsvファイルを読む
f =open(r'D:\360MoveData\Users\cmusunqi\Documents\GitHub\R_and_python\python\ワードクラウドとクローラー\弾幕.csv',encoding='utf-8')
txt=f.read()
# jieba参加者
txt_list=jieba.lcut(txt)
# 単語分割後のリストをスペースで接続する
string=' '.join(txt_list)
# ワードクラウドを描画するには、組み込みパラメータの公式コードを確認してください
w=wordcloud.WordCloud(
width=1000,
height=700,
background_color='white',
font_path="msyh.ttc",
scale=15,
stopwords={" "},
contour_width=5,
contour_color='red')
# 画像をpngとしてエクスポート
w.generate(string)
w.to_file(r'D:\360MoveData\Users\cmusunqi\Documents\GitHub\R_and_python\python\ワードクラウドとクローラー\ciyun.png')
描かれたワードクラウドの最大の言葉は、恐れと不意を突かれることです。恐れている場合は、PYoを見てください。
love&peace
Recommended Posts