色综合老司机第九色激情 _中文字幕日韩av资源站_国产+人+亚洲_久久久精品影院_久久久视频免费观看_欧美激情亚洲自拍_亚洲成av人片在线观看香蕉_热草久综合在线_欧美极品第一页_2020国产精品自拍

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > Python實現文章自動生成

Python實現文章自動生成

來源:千鋒教育
發布人:xqq
時間: 2023-11-06 23:13:31 1699283611

下面的Python程序實現了通過從網頁抓取一篇文章,然后根據這篇文章來生成新的文章,這其中的原理就是基于概率統計的文本分析。

過程大概就是網頁抓取數據->統計分析->生成新文章。網頁抓取數據是通過BeautifulSoup庫來抓取網頁上的文本內容。統計分析這個首先需要使用ngram模型來把文章進行分詞并統計頻率。因為文章生成主要依據馬爾可夫模型,所以使用了2-gram,這樣可以統計出一個單詞出現在另一個單詞后的概率。生成新文章是基于分析大量隨機事件的馬爾可夫模型。隨機事件的特點是在一個離散事件發生之后,另一個離散事件將在前一個事件的條件下以一定的概率發生。

fromurllib.requestimporturlopen

fromrandomimportrandint

frombs4importBeautifulSoup

importre

defwordListSum(wordList):

sum=0

forword,valueinwordList.items():

sum=sum+value

returnsum

defretrieveRandomWord(wordList):

randomIndex=randint(1,wordListSum(wordList))

forword,valueinwordList.items():

randomIndex-=value

ifrandomIndex<=0:

returnword

defbuildWordDict(text):

text=re.sub('(\n|\r|\t)+',"",text)

text=re.sub('\"',"",text)

punctuation=[',','.',';',':']

forsymbolinpunctuation:

text=text.replace(symbol,""+symbol+"")

words=text.split('')

words=[wordforwordinwordsifword!=""]

wordDict={}

foriinrange(1,len(words)):

ifwords[i-1]notinwordDict:

wordDict[words[i-1]]={}

ifwords[i]notinwordDict[words[i-1]]:

wordDict[words[i-1]][words[i]]=0

wordDict[words[i-1]][words[i]]=wordDict[words[i-1]][words[i]]+1

returnwordDict

defrandomFirstWord(wordDict):

randomIndex=randint(0,len(wordDict))

returnlist(wordDict.keys())[randomIndex]

html=urlopen("http://www.guancha.cn/america/2017_01_21_390488_s.shtml")

bsObj=BeautifulSoup(html,"lxml")

ps=bsObj.find("div",{"id":"cmtdiv3523349"}).find_next_siblings("p");

content=""

forpinps:

content=content+p.get_text()

text=bytes(content,"UTF-8")

text=text.decode("ascii","ignore")

wordDict=buildWordDict(text)

length=100

chain=""

currentWord=randomFirstWord(wordDict)

foriinrange(0,length):

chain+=currentWord+""

currentWord=retrieveRandomWord(wordDict[currentWord])

print(chain)

buildWordDict(text)函數接收文本內容,生成的內容如下

{‘itself’:{‘,’:1},‘night’:{‘sky’:1},‘You’:{‘came’:1,‘will’:1},‘railways’:{‘all’:1},‘government’:{‘while’:1,‘,’:1,‘is’:1},‘you’:{‘now’:1,‘open’:1,‘down’:1,‘with’:1,‘.’:6,‘,’:1,‘that’:1},

主要就是生成一個字典,鍵是文章中所有出現的詞語,值其實也是一個字典,這個字典是所有直接出現在鍵后邊的詞語及其出現的頻率。這個函數就是ngram模型思想的運用。

retrieveRandomWord(wordList)函數的wordList代表的是出現在上一個詞語后的詞語列表及其頻率組成的字典,然后根據統計的概率隨機生成一個詞。這個函數是馬爾可夫模型的思想運用。

然后運行這個程序會生成一個長度為100的文章,如下面所示

fail.Wewillstirourselves,butwewillneverbefore.Donotshareoneheartandpleasantitbackourjobs.Weareinfusedwiththeorderlyandrailwaysallofthegangsandrobbedourjobsfortheirsuccesswilldeterminethecivilizedworld.Wewilltheirsuccesswillbeagreatmenandhighwaysandmillionstoallbleedtheworld.Itbelongstogreatnationalefforttodefendourproducts,constantlycomplaining,D.Wewillbeignoredagain.ItbelongstoharnesstheexpenseofAmerica.

生成的文章看起來語法混亂,這也難怪,因為只是抓取分析統計了一篇的文章。我想如果可以抓取足夠多的英文文章,數據集足夠大那么語法準確度會大大提高。

以上內容為大家介紹了Python實現文章自動生成,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。http://www.duolefu.net/

tags: python培訓
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
色综合老司机第九色激情 _中文字幕日韩av资源站_国产+人+亚洲_久久久精品影院_久久久视频免费观看_欧美激情亚洲自拍_亚洲成av人片在线观看香蕉_热草久综合在线_欧美极品第一页_2020国产精品自拍
亚洲欧美一区二区三区国产精品| 国产视频在线观看一区二区三区| 国产呦精品一区二区三区网站| 欧美精品日韩一本| 一二三区精品视频| 国产成人在线电影| 91精品国产aⅴ一区二区| 欧洲一区二区三区在线| 久久久久久久国产精品影院| 欧美网站大全在线观看| 在线看一区二区| 蜜臀久久久99精品久久久久久| jlzzjlzz亚洲日本少妇| 91免费版在线看| 怡红院av一区二区三区| 成人在线综合网| 91麻豆精品91久久久久久清纯| 免费欧美日韩国产三级电影| 欧美丝袜自拍制服另类| 久久久精品影视| 国产精品一区2区| 岛国精品在线观看| 色婷婷av一区| 一区二区不卡在线播放 | 亚洲综合无码一区二区| 亚洲老司机在线| 大美女一区二区三区| 久久精品国产一区二区| 欧美日韩激情一区二区三区| 亚洲国产精品二十页| 国产成人精品午夜视频免费| 久久久综合视频| 成人黄色免费短视频| 国产午夜精品久久久久久久| 国产成人精品www牛牛影视| 91久久香蕉国产日韩欧美9色| 日本不卡高清视频| 69成人精品免费视频| 国产呦萝稀缺另类资源| 亚洲成人动漫av| 国产一区二区在线看| av在线播放成人| 视频一区二区三区在线| 欧美丰满少妇xxxbbb| 99国产精品99久久久久久| 日韩黄色免费电影| 欧美丰满嫩嫩电影| 7777精品伊人久久久大香线蕉的| 欧美区视频在线观看| 欧美成人午夜电影| 欧美日韩一区二区不卡| 老司机免费视频一区二区三区| 亚洲国产裸拍裸体视频在线观看乱了| 国产精品视频在线看| 欧美亚洲国产一区二区三区| 色综合久久综合网欧美综合网 | 久久99精品国产麻豆婷婷洗澡| 国内精品第一页| 午夜精品久久久久久久99樱桃| 91精品欧美一区二区三区综合在 | 国产亚洲综合色| 日本午夜精品视频在线观看| 婷婷久久综合九色综合绿巨人| 亚洲超碰97人人做人人爱| 亚洲午夜久久久| 男女激情视频一区| 亚洲精品国久久99热| 久久久久成人黄色影片| 欧美色图第一页| 91首页免费视频| 欧美亚洲动漫精品| 91久久精品一区二区| 亚洲一区欧美一区| 亚洲一区二区影院| 亚洲情趣在线观看| 亚洲激情自拍偷拍| 午夜精品福利一区二区蜜股av| 亚洲三级电影全部在线观看高清| 久久一夜天堂av一区二区三区 | 欧美成人免费网站| av中文字幕不卡| 国产成人精品一区二| 在线免费观看日本欧美| 一区二区三区欧美| 中文字幕在线视频一区| 欧美一区二区三区视频免费| www.欧美.com| 国产日韩欧美精品一区| 石原莉奈在线亚洲二区| 男男gaygay亚洲| 欧美日韩午夜影院| 亚洲电影第三页| 一区二区久久久| 国产一区中文字幕| 5月丁香婷婷综合| 久久精品人人做人人爽97| 日韩三级精品电影久久久| 久久一区二区三区四区| 夜夜精品视频一区二区| 成人深夜在线观看| 欧美精品v国产精品v日韩精品 | 国产精品欧美久久久久无广告| 亚洲一区二三区| 亚洲欧洲美洲综合色网| 亚洲人成网站在线| 欧洲精品在线观看| 日本一区二区电影| 亚洲激情av在线| 亚洲狠狠丁香婷婷综合久久久| 国产精品羞羞答答xxdd| 国产成人av电影在线| 日韩一区二区三区视频在线| 亚洲午夜三级在线| 精品88久久久久88久久久| 国产欧美一区二区三区沐欲| 国产精品美女久久久久av爽李琼| 中文字幕一区二区三中文字幕 | 国产精品一级片| 精品国产一区二区在线观看| 人妖欧美一区二区| 欧美日韩www| www.成人网.com| 亚洲亚洲人成综合网络| 精品国产髙清在线看国产毛片 | 亚洲一区二区三区四区的 | 91官网在线观看| 亚洲视频网在线直播| 欧美性猛交xxxx乱大交退制版| 欧美一级日韩一级| 99国产麻豆精品| 亚洲国产精品久久艾草纯爱 | 久久九九影视网| 精品国产91洋老外米糕| 中文字幕在线播放不卡一区| 国产在线精品一区在线观看麻豆| 亚洲免费毛片网站| 欧美色视频在线观看| 中文一区二区完整视频在线观看| 一区二区三区日本| 日韩亚洲电影在线| 日本不卡一区二区| 色综合天天在线| 亚洲欧美另类久久久精品2019| 91黄色免费版| 久久女同性恋中文字幕| 136国产福利精品导航| 宅男在线国产精品| 日本高清视频一区二区| 欧美视频一区二区三区四区| 欧美一级理论性理论a| kk眼镜猥琐国模调教系列一区二区| 天天操天天干天天综合网| 亚洲成人一区二区在线观看| 中文字幕av一区二区三区免费看| 337p日本欧洲亚洲大胆精品| 久久久五月婷婷| 亚洲欧美偷拍三级| 国产精品卡一卡二卡三| 一色桃子久久精品亚洲| 国产精品欧美久久久久一区二区| 国产精品18久久久久久久久| 一区二区三区在线影院| 国产欧美日韩综合| 国产精品美女久久福利网站| 日韩视频免费观看高清完整版| 99精品视频一区| 91视频在线看| 国产99久久久国产精品免费看| 成人爱爱电影网址| 7799精品视频| 一区二区三区四区乱视频| 亚洲国产精品一区二区久久| 26uuu亚洲综合色欧美| 亚洲日穴在线视频| 日韩视频永久免费| 国产精一区二区三区| 欧美激情资源网| 精品一区二区在线视频| 久久久久久久久久久久久夜| 国产98色在线|日韩| 日韩av电影天堂| av亚洲精华国产精华精华| 久久久久久免费网| 久久欧美一区二区| 亚洲最新视频在线播放| 91麻豆精品国产无毒不卡在线观看| 国产成人午夜99999| 欧美主播一区二区三区| 精品一二三四区| 亚洲一区二区视频在线| 五月婷婷久久丁香| 欧美日本在线看| 日本亚洲电影天堂| 欧美tickle裸体挠脚心vk| 国产日韩三级在线| 高清av一区二区| 一区二区三区日韩在线观看| 精品视频在线视频| 蜜臀av一区二区三区| 亚洲欧美激情一区二区|