
HSBC's blockbuster report: Can AI track the Federal Reserve?

通過分析 54 篇美聯儲講話,滙豐發現,對於分析與貨幣政策高度相關的講話,AI 工具與人類專家的結論在大多數情況下接近;然而,在處理相關性較低的講話時,AI 可能會生成不準確甚至虛構的內容。AI 有潛力提高生產力,但目前尚不足以完全取代人類分析師。
近日,滙豐銀行發佈了一份題為《AI 能追蹤美聯儲嗎?》的報告,深入探討生成式人工智能在分析美聯儲官員講話及預測貨幣政策方向中的潛力與侷限。
滙豐開發了一款基於 GPT-4 的 AI 工具,專門用來自動評估美聯儲講話的相關性、內容摘要、政策傾向(鷹派/鴿派/中性)及其背後理由。
通過分析 54 篇美聯儲講話,滙豐發現,對於分析與貨幣政策高度相關的講話,AI 工具的表現接近於一位 “努力工作的初級分析師”,並且與人類專家的結論在大多數情況下接近。
然而,在處理與貨幣政策無關或相關性較低的講話時,AI 可能會生成不準確甚至虛構的內容,降低了用户的信任度。
因此,滙豐的結論是,AI 工具雖有潛力提高生產力,但目前尚不足以完全取代人類分析師,尤其是在高精度要求的任務中。
AI 分析美聯儲講話
滙豐開發的 AI 工具通過 “逐句篩選 + 整體分析” 的方法,對美聯儲官員的講話進行四個方面的分析:相關性篩選、內容摘要、政策傾向判斷(鷹派、鴿派或中性)以及決策依據説明。

研究團隊希望通過這一工具回答一個核心問題:AI 是否能夠可靠、準確地分析美聯儲的政策信號,從而為投資者提供實用的參考。
報告指出,AI 工具在分析高度相關的講話時表現令人印象深刻,其產出質量與一位 “努力工作的初級分析師” 相當。尤其在判斷政策傾向時,AI 的結果與人類專家大致一致。
例如,在研究的 54 篇講話中,AI 在判斷其為 “中性” 時與人類專家完全一致,而在評估 “鷹派” 或 “鴿派” 時也較少出現重大偏差。
“我們可以看到,現在對鴿派或中立的演講沒有任何分歧。對於模型視為鷹派的 10 次演講,我們的人類專家同意這一觀點的演講有 8 次,其他專家認為,只有 2 次演講是中立的。”
AI 的不足:隨機性與 “創造性” 挑戰
儘管 AI 工具展現了一定的能力,但報告也指出了多項 AI 的短板。
首先,生成式 AI 的 “創造性” 有時會導致問題,尤其在處理與貨幣政策無關的講話時,AI 可能會虛構信息以 “滿足” 用户需求。這種現象被稱為 “幻覺”(Hallucination),可能會嚴重損害用户對工具的信任。
“人工智能模型已經被訓練得表現出強烈的幫助願望,它會傾向於編造信息來給你答覆,而不是提醒你,你的問題令人困惑或無法回答。”
此外,AI 工具在重複任務中的不一致性也是一個關鍵挑戰。報告發現,即使在相同條件下,AI 對同一講話的分析結果可能會有所不同。

滙豐的研究團隊強調,雖然人類分析師在一定程度上也存在主觀性,但單一分析師在不同時間對同一內容的解讀通常具有一致性,而 AI 卻無法保證這一點。
AI 能取代分析師嗎?
滙豐的研究表明,儘管 AI 工具在分析任務中有一定表現,但其目前仍無法完全取代人類分析師的作用。
報告指出,AI 在一些較為基礎和重複性的任務中,如篩選相關信息和生成摘要,表現出色。然而,在涉及複雜推理和深度解讀的工作中,AI 與人類的差距仍然明顯。
滙豐表示,AI 工具的表現類似於初級分析師的水平,但它無法像人類一樣通過經驗和反饋不斷改進。這一點對企業來説尤為重要,因為培養人類分析師不僅是為了當前的產出,也是為了未來的發展潛力。
報告還強調,AI 的 “隨機性” 和 “創造性” 特質雖然為技術帶來了靈活性,但也成為廣泛應用的障礙。在金融市場等高精度需求領域,用户對結果的穩定性和可信度要求極高。如果 AI 工具的產出需要人類專家反覆核查,其所謂的效率提升將大打折扣。
“但當你向⼈⼯智能⼯具詢問它的意見時,它的意見會時時刻刻發生變化。除非人性發生根本性變化,否則人工智能⼯具很可能無法充當值得信賴的顧問。這在短期內似乎不太可能發生。”

