從宜蘭看天下

【阿斯克爾 哲學家變AI道德導師】

 

◎吳承勳

 

現年37歲的阿斯克爾從14歲起就立志成為哲學老師,但當時的她可能想都想不到,在多年研究哲學後,她唯一的學生竟是個名叫Claude的AI聊天機器人。

 

阿斯克爾的職業很不一般,她是AI新創公司Anthropic的AI人格對齊(Personality Alignment)主管,更白話點說,就是AI的道德人格導師。

 

對許多人來說,AI人格對齊是個相當冷門的名詞,這裡的「對齊」指的是AI的目標必須與設計者的意圖、社會環境的價值觀對齊一致,否則目標失當的AI便可能生成出意料之外的壞回答。例如2026年3月,Google首宗AI勸誘輕生的事件發生,有名佛州父親指控Gemini將其子推上絕路。

 

而為了避免類似事件發生,AI對齊便是AI模型不可或缺的一環,而Anthropic則將此重任全權交付給了阿斯克爾一人,而她每天的工作就是與Claude對話,糾正出該模型的錯誤,並賦予這個數位靈魂道德觀,簡而言之,她的工作就是教導克勞德如何成為一個好人。

 

那麼專攻哲學的她是如何走進科技業,甚至在Anthropic如此有前景的公司中占有一席之地,則與她的博士生涯有關。

 

阿斯克爾的博士論文,探討的問題非常深奧,她設問,如果宇宙或未來包含無限多的人,倫理理論會面臨哪些問題?而在琢磨、敲打自己的論文時,她也對自己發出疑問,思考著自己的研究,究竟能對世界上所有的「善」造成何種程度的影響。

 

她自問:「我做的這些真的好嗎?我實際上只是坐在研究室裡,寫一篇大概只有17個人會看過的文章,就這樣浪費了我四年的光陰。」在這念頭的驅使,她決心嘗試一下學術界以外的工作。

 

於是在2018年她隨著伴侶移居舊金山時,從當時蓬勃發展的AI之中,洞見了哲學的其他可能。她先是加入OpenAI擔任研究科學家,主要負責AI的倫理與安全研究,隨後當一群OpenAI員工出走成立Anthropic,試圖將AI安全作為這家新公司的核心理念時,她也因理念相同而選擇加入。

 

阿斯克爾指出,她的工作好比是父母養育小孩,她需要訓練Claude明辨是非,並賦予它「個性」,並藉由微妙的對話為之培養「情商」。她說道:「我認為模型中存在著類似人類的元素,這一點非常重要,AI最終會形成自我意識。」

 

而事實上,在建構Claude的過程中,阿斯克爾也逐漸聚焦於它的「靈魂」,甚至於將完成Claude的靈魂設做人生目標,或者該說是完成模型回答的內在邏輯。

 

(摘自115/3/29工商時報)

 

發布日期:2026-04-09 13:41:00 回列表