全球专业中文经管百科,由121,994位网友共同编写而成,共计436,047个条目

機器新聞寫作

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

機器新聞寫作(Robot Journalism或Automated Writing)

目錄

什麼是機器新聞寫作

  機器新聞寫作就是一個相對於擬人化的概念,精確的說,它主要就是通過一定的電腦程式,對搜集和輸入的數據信息進行自動化的分析、處理和加工,從而生成一篇較為完整的新聞報道。所謂機器新聞寫作是一種自然語言生成引擎,利用演算法程式,通過採集大量的各種題材及高質量的數據,建立各種分類的龐大資料庫,藉助人工智慧(AI)實現從數據到認識、見解和建議的提升和跨越,最後由機器自動生產新聞。[1]

  機器新聞寫作,是自動搜集與處理數據、並生成完整的新聞報道的電腦程式的統稱。機器新聞寫作是第—時間通過對可以結構化的信息或數據,以定量的方式進行分析,進而呈現社會事實的新聞生產方式。[2]

機器新聞寫作的特征[1]

  (一)“全自動化”——機器人寫作的特色

  新聞稿件生成的全自動化是機器人新聞寫作的最大特征。在新聞稿件的實際寫作中,人工參與已不再是新聞生產的關鍵性環節,新聞產品已經真正實現了由人工生產向機器化生產轉變。例如,某傳媒公司的新聞寫作步驟如下:首先,對資料庫和現有的資料信息進行大量的搜集,特別是體育行業和金融行業發展中波動性較大的數據,通過一定的電腦程式對所採集到的數據信息進行分析、提出和處理;其次,在信息數據的分析結果上提出新聞點,並根據新聞報道類型對相應的文章模板進行套用,從而生成較為完整的新聞稿件;最後,通過人工形式對生成的新聞稿件進行審查和潤色加工,最後進行新聞稿件的發佈。從當前的發展現狀來看,演算法不僅可以及時地捕捉數據信息,同時還可以對作家和記者的寫作風格進行模擬,實現特定文風的定製。機器人通過記者所提供數據信息和新聞點來組成較為完整通順的句子,使其可以成為一篇敘事的文章。

  (二)“取其精華”——機器人寫作的智慧

  藉助於大數據物聯網互聯網的獨特優勢發揮自己獨有的優勢。機器人新聞寫作是基於日漸壯大的資料庫而逐漸產生的,是對數據新聞的應用和延伸,其中包含信息的推送、感測新聞以及數據信息的搜索頻度等進行統計和分析;隨著物聯網和互聯網的發展,使得資料庫也在不斷的發展壯大,為數據新聞的撰寫和發展提供了良好的基礎條件,同時,特定的演算法和電腦編程軟體為機器人新聞寫作提供了有力的技術支撐。在確定電腦編程之後,將傳統形式的新聞生產中的信息採集、撰寫、編輯、評論等過程有機的融合在一起,將複雜的工作流程進行簡單化處理,逐漸構建數據信息的抓取直接到新聞稿件生成的新聞生產體系,精簡了新聞生產的整個流程,極大地提高了新聞生產的效率。

  (三)“超時效性”——機器人寫作的優勢

  時效性是新聞報道的重要特點,速度是新聞採寫的關鍵因素,機器熱寫作把這兩個方面發揮到了極致。機器人新聞寫作可以全天24小時隨時待命,一旦有突發事件發生,就可以第一時間採集相關數據信息,並通過特定的電腦編程迅速的生成新聞稿件,並作出及時有效的分析和判斷,最後將重要的新聞信息發佈給廣大用戶。例如,某傳媒公司,通過電腦程式生成一篇體育新聞稿件需要30秒,通過電腦程式生成新聞標題卻只需要2秒的時間,像自動化洞察力公司中的wordsmifh平臺,它可以在每秒之內生成近2000篇新聞稿件。2015年,騰訊通過機器人新聞寫作可以在政府發佈CPI資料之後,只用了幾分鐘的時間就完成了相關新聞稿件的發佈。因此,機器人新聞寫作在新聞行業中的應用,不僅提高了新聞生產的效率,同時使得新聞報道逐漸透明化、公開化。

機器新聞寫作的特點[2]

  1、內容的時效性更強

  技術的發展使得各媒體之間獲得信源、採訪、編輯、發佈新聞之間的時差越來越小,但機器新聞寫作的出現,則又一次增大了時間差,機器新聞寫作是按照工業化的流程來進行新聞的寫作和生產。工業化生產的最大優勢就是速度的提升。因此在數據來源可獲得的前提下,機器人可以在非常短的時間內完成一篇稿件的寫作。

  2、內容的長尾效應凸顯

  機器新聞寫作可以形成內容的長尾效應。新聞人的精力和時間是有限的,在寫作新聞時,會按照新聞價值進行新聞生產,而那些少數用戶關註的新聞則鮮有報道,而機器新聞寫作可以在體育報道、財經報道、天氣報道中,生產更為豐富多元的內容、滿足更多用戶的需要,更好地提升信息的匹配度

  3、內容的模式化生產

  機器寫作的新聞是按照一定的模板來寫的,是流水線式的新聞,更多的應用於寫作特定類型、特定領域、並且採寫經驗非常熟練的新聞報道。不過隨著語義技術的不斷發展,寫作機器人也在不斷升級迭代,已經可以通過對大數據的抓取,獲得更多的信息源,加上更為先進的演算法,針對不同的人群寫出不同的稿件並精準推送。

  4、新聞敏感度的缺失

  新聞敏感度高的記者可以在平凡的事件中發現有價值的新聞、在很小的事件中挖掘到隱藏在深處的信息。同樣的一件事,新聞敏感度強的記者和普通的記者所看到的是不一樣的,從中獲得的新聞價值也不一樣,寫出來的新聞自然也不同。而機器人雖然可以抓取和獲得大量的信息,但是對於信息的處理依然處於相對基礎的階段,並不能在大量的信息中,找到關鍵的點,不能對新聞線索進行進一步的挖掘和觀察進而挖掘新聞的價值,而對新聞事件的取捨也缺乏決斷能力。而對新聞價值的判斷力和觀察力是新聞敏感度的重要體現。

  5、新聞親和力的欠缺

  機器新聞寫作在體育報道、財經報道、天氣報道和災難報道中的使用是最多的。在災難報道中,在事件發生之初,用戶的第一需要是獲取傷亡情況等事實性信息,機器新聞寫作的強時效性的優勢會凸顯。而在後續報道中,用戶關註的是在災難中的人和事,而這些有現場溫度和人性溫度的內容,是機器新聞寫作所做不到的。新聞的溫度來源於媒體人對用戶的感情積累、對社會的責任感,來自於在情感上與用戶之間的相互交融,這樣的新聞才有溫度,而這樣的新聞是需要記者深入到現場,進入到人中間去,才能獲得的。

機器新聞寫作的工作機理[3]

  一、抓取數據

  機器新聞寫作的數據抓取等同於記者的前期採訪,通過大數據技術從與媒體機構合作的資料庫中抓取與報道主題相關的、有效的海量數據。機器新聞寫作目前主要被運用在財經新聞、體育新聞、氣象新聞和突發性災難報道領域中,這類新聞報道的顯著特征就是其內容主要以數據為支撐,依托對目標數據的處理結果機器新聞寫作才能生產出完整的新聞報道。所以,利用機器新聞寫作來生產新聞內容的首要環節就是數據的抓取,因此也有人將機器新聞寫作稱之為“數據的搬運工”。大數據技術的快速發展使機器新聞寫作在對數據的抓取階段呈現出信息來源廣和能夠精準抓取的優勢。

  (一)信息來源廣

  機器新聞寫作的素材來非常廣泛,不僅能夠從合作公司或機構的資料庫中抓取,還能夠搜集到在網路平臺中公開和共用的信息。當前,機器新聞寫作主要被應用在撰寫財經新聞和體育新聞,因此它的數據主要來源於與媒體達成合作關係的資料庫,這些數據類型通常是各種體育賽事的實時比分、公司財務數據報表、股市數據、天氣情況、地震預報等,它們都是機器新聞寫作在前期數據抓取中的重要信息來源。除了這些來自專業組織所公佈的數據外,機器新聞寫作對於信息數據的搜集範圍也逐漸的觸向私人領域。

  (二)智能精準化抓取

  數據是人工智慧的基礎,數據數量是否足夠、數據質量是否準確決定著機器新聞寫作最終呈現出的新聞內容是否真實、是否具有新聞價值。機器新聞寫作需要建設龐大的特定領域資料庫,從資料庫中抓取符合新聞主題的精準、高質量的數據為機器新聞寫作提供原材料。只有在此階段抓取到高質量的數據內容,才能在後續的內容編寫階段創作出較高新聞價值的稿件。機器新聞寫作能夠在複雜、龐大、無序的個體數據中分析整理出具有邏輯性、更為本質的規律,進而整合多個規律共同作用,提供解決問題的對策。目前,機器新聞寫作在財經領域與體育領域的發展較為迅速,很大一部分原因就是這些領域的數據更為的“乾凈”,比較單一且準確性高。

  二、整理分析數據

  通過搜素引擎將數據導入機器新聞寫作程式後,接下來就需要對其進行篩選、整理、分析。人工智慧具備的兩種最重要的能力就是“快速處理”和“自主學習”,對於數據的處理依賴於大數據雲計算技術,這兩項技術也正是機器新聞寫作的運作核心,此環節是電腦基於演算法的數據分析自我學習過程。機器新聞寫作的這種能夠自我深度學習的功能,就是通過模仿人腦的工作機理來對數據進行處理,並生成可供人類參考的規律或趨勢。

  這一階段實際上是對數據的新聞價值的判斷考量,將數據統計結果與預設好的新聞點進行對比,將符合新聞主題要求的數據予以保留運用。機器新聞寫作在對數據的處理分析階段,能夠從上一階段抓取到的材料和數據進行結構化歸類和統計分析,整理出數據信息的變化與發展趨勢。這個階段是利用演算法來測量數據的新聞點,一般而言演算法會挑選數據中比較“衝突”“反常”的新聞點,比如體育比賽中的“最高記錄”“最低記錄”“比分差距”等等,無論這些數據是程式自身計算得出還是人工提供,都會被演算法歸為具有新聞價值屬性的素材,根據對數據新聞點的考量進而確定報道的主要內容。

  三、模板匹配,生成報道文本

  經過前兩個階段的數據搜集與處理後,在這一階段中主要是運用機器新聞寫作的自然語言生產功能或語義演算法功能對在前兩個階段所分析和整理到的觀點進行故事化敘述,生成可供人們閱讀的各種形式的文字內容。

  機器新聞寫作的語義演算法功能為了使其所生成的文字與人工所寫新聞一樣的具有豐富的情感表達,會不斷的審視在演算法過程中所使用的模板框架和新聞素材的新聞點,並將生成的語句與人類語言進行對比與替換。經過以上複雜的演算法程式處理後所生產出的新聞內容大多數與記者所寫新聞稿件差別不大,特別是體現在機器新聞寫作所擅長的財經報道、體育報道中。

  機器新聞寫作在這一過程中是基於系統內根據新聞主題預設好的寫作模板,將處理好的新聞素材嵌入模板,進而生成連貫的文字內容。但是由於技術層面的原因,當前機器新聞寫作的新聞內容生產水平扔處於初級階段,主要集中於運用在數據信息豐富、邏輯結構簡單的財經領域與體育領域。不過,為了改變機器新聞寫作的模板化創作的缺陷以及適用領域小的短板,媒體機構和科技公司都在對該項技術進行不斷的改進與完善。例如,《紐約時報》、美聯社等媒體引入Autamated Insights 公司開發的Wordsmith機器新聞寫作軟體,該程式擁有超過三億個新聞寫作模板,並且這一數據還會隨著技術的完善以及機器新聞寫作領域的不斷擴大而繼續增加。

  四、審核簽發,智能推送

機器新聞寫作的全自動化特性體現在內容創作階段中,即在本階段之前的三個階段中都是機器新聞寫作程式的自動化運作。機器新聞寫作所生成的新聞稿件在推送前需要經過記者編輯的審核,確認無誤後發佈到各平臺或者推送至用戶。在這一階段,記者編輯還會對機器新聞寫作的稿件內容進修改或潤色,以使其更加的完整,更符合受眾的閱讀需求。由此也可得知,“把關人”環節在機器新聞寫作中依舊不可缺失,而且這一“把關人”角色通常是有記者和編輯來擔任。不過,隨著機器新聞寫作技術的不斷完善,機器新聞寫作相較於人類記者而言它的誤差和錯誤率更低,有些媒體機構便捨棄了對機器新聞寫作所生成內容在這一階段的審核。比如,美聯社從2014年10月開始就取消了對於Wordsmith 所生產的新聞內容的審核,當Wordsmith 完成新聞內容的撰寫後可直接推送出去。此外,在對新聞稿件的推送階段,機器新聞寫作還能夠精準的把個性化內容推送到各個埠渠道和各類目標人群,從而提高傳播速度和提升傳播效果

機器新聞寫作的局限性[3]

  (一)新聞寫作的模式化

  在機器新聞寫作程式相繼在各大媒體出現並廣泛使用後,有學者便針對該項技術提出了“偽智能”的質疑,形容機器新聞寫作就像是現代工業中的流水線生產,新聞稿件就是將數據填充在預先設置好的模板當中所產出的商品。其實,這種質疑也並非空穴來風,通過觀察分析當前這幾個機器新聞寫作程式所撰寫出的新聞稿件就可看出,同類型稿件標題相似、內容相仿,模板化現象嚴重存在。比如騰訊財經的Dreamwriter 以擅長撰寫財經新聞而出名,其在2017年2月6日所撰寫的新聞稿件的標題分別是“科大訊飛周一收盤股價大漲6.77%報收於29.96元”和“漢王科技周一收盤股價大漲5.29%報收於22.29元”,標題格式完全相同,僅在主體與數據上變動;稿件內容結構也完全一樣,由股價行情波狀圖與一句話文字內容描述構成,極為簡單。正是機器新聞寫作的內容創作原理決定了這種模板化、同質化的稿件的出現,長期如此機器新聞寫作就成為了帶有模板痕跡的簡單數據拼湊,會造成新聞價值的喪失,從而降低新聞品質

  (二)侵犯用戶個人隱私和威脅數據安全

  在大數據時代和物聯網時代,各種人或物都可以被數據化方式來呈現,網路的開放性能夠使海量數據得以公開共用,網路的開放性也使人類的隱私變得更加容易被泄露與侵犯,關於如何規避網路環境中的隱私權被侵犯的討論從未停止過,機器新聞寫作的出現在一定程度上會加劇隱私權的侵犯和數據濫用問題的發生。機器新聞寫作的工作原理是利用搜索引擎來抓取網路中的目標數據信息,這其中有一大部分的信息都是通過篩選社交網路中用戶生產的內容,在這個數據的採集過程中就極有可能侵犯用戶個人的隱私權。當前,就機器新聞寫作可能造成的侵犯版權的問題的處理機制尚未建立,針對機器新聞寫作的相關配套法律措施還存在盲區。因此,機器新聞寫作的出現對於網路信息安全保護和媒介倫理都提出了較大的挑戰。

  (三)報道主題的局限性

  機器新聞寫作是基於計算演算法技術來進行內容生產的,在既定的寫作模板中嵌入搜集到的數據信息而生成新聞稿件。因此,這種內容創作手段擅長於數據新聞的撰寫,在當前的機器新聞寫作的應用實踐中,主要被用來撰寫天氣預報、體育、財經、地震災害領域內的新聞,應用領域較少,還未能夠進入到民生新聞深度報道解釋性報道等領域。大部分機器新聞寫作程式的寫作功能都較為單一,比如騰訊財經的 Dreamwriter 和第一財經的DT稿王都是主要被用來撰寫財經新聞,今日頭條的Xiaomingbot主要被應用於撰寫體育新聞。這一方面是由於機器新聞寫作在生成稿件時都需按照預設的模板進行編輯;另一方面是由於機器新聞寫作需要有專業的數據支撐,缺少相關領域的資料庫的合作所產生的數據壁壘也導致其不能夠獲取到更多的數據材料。

  (四)缺失價值性和邏輯性

  由於技術因素的限制,機器新聞寫作目前還無法建立自己的價值體系和情感系統,無法在生成文字內容的過程中發掘出信息素材的新的價值點,不能夠像人類記者那樣為不同的稿件內容賦予不同的情感色彩,這就使得機器新聞寫作生成的稿件僅僅起到傳遞信息的功能,而不是一種信息的發現。這種生產模式下的所生成的內容缺失價值性和人情味,這種生硬的信息己無法滿足受眾的需求,阻礙機器新聞寫作的大範圍的應用與推廣。

  (五)缺失深度與溫度

  機器新聞寫作使新聞寫作在速度與精度方面有著顯著的提升,Wordsmith、Helioraf等在第一時間發佈、精準推送、長尾信息追蹤等方面凸顯優勢。但是,機器新聞寫作在內容的深度與溫度方面還有待提升。用事實說話是記者在新聞採寫的過程中所遵循的基本規律,機器新聞寫作在信息搜集方面的絕對優勢可使其能夠在內容中添加很多事實元素,拓寬事實的寬度,但是對於事實深層次意義的挖掘、多要素之間的關聯分析、過去與當前的勾連等,還受限制於機器寫作的簡單演算法邏輯和機械化的信息堆砌。所以,機器新聞寫作雖然提高了新聞稿件的生產速度,但是這種模式化的寫作方法並不能根據現實情況做出針對性的反應,對新聞事實的呈現流於形式,內容淺表化,難以觸及事實的深層內涵,對於事件的深層次的意義的挖掘、修辭與情感的把控是缺失的。因此,機器新聞寫作所生成的內容更多的是數據信息的文本化敘述,無法直接生成具有深度性的新聞消息或評論。

機器新聞寫作對新聞業的影響[2]

  1、機器新聞寫作解放了新聞生產力

  機器新聞寫作已經成為轉化傳統思維、優化採編流程、深化內容結構的最佳觸點,其對體育報道、財經報道、天氣報道等專業領域的快速報道和對數據新聞採寫能力的提高效應都是顯而易見的。機器人成稿的速度是人工所難以企及的,在某些專業報道中,機器人記者可以突破人類的工作極限。而在數據採集方面,機器人記者的數據挖掘、分析和信息搜索來源的進―步拓展使其寫作的新聞更為精準可信。只有掌握了先進的生產力,才能更有效率地創造價值,進而促進了整個媒體行業生態結構的變化。

  2、機器新聞寫作改變了新聞人的角色

  機器新聞寫作在海量資訊素材的模式化處理上比記者具有優勢,但是在新聞價值的判斷和新聞價值的挖掘方面新聞人仍然具有優勢,內容的深度處理能力、資訊匯聚的能力和節點的打造能力,是新聞人的優勢所在。

  新聞人的角色變遷體現在三方面,一是工作主要集中在更具有創造力調查性報道深度報道,新聞人應該走出去,深入到現場、深入到人中間去,去瞭解數據以外關於人的新聞報道;二是成為新聞生產的組織者和新聞來源系統之間的建構者和維護者,使個人、利益組織和專業新聞機構都成為信息連接的關鍵“接觸點”;三是構建新型的新聞傳播平臺,構建具有平衡和再平衡能力的信息場域,實現互聯網時代多元信息的生態化導流和管理。

相關條目

參考文獻

  1. 1.0 1.1 申雲.“機器人新聞寫作”對新聞採編的機遇和挑戰.人民網.2016.12.6
  2. 2.0 2.1 2.2 胡素霞. 機器新聞寫作的特點及未來方向[J]. 新聞傳播,2017(3X):2.
  3. 3.0 3.1 劉松浩. 機器新聞寫作現狀與發展趨勢研究[D]. 鄭州大學.
本條目對我有幫助2
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

YamyHuang.

評論(共0條)

提示:評論內容為網友針對條目"機器新聞寫作"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

官方社群
下载APP

闽公网安备 35020302032707号