昶懋玉蘭園-台灣官方網站

從宜蘭看天下

◎吳承勳

現年37歲的阿斯克爾從14歲起就立志成為哲學老師，但當時的她可能想都想不到，在多年研究哲學後，她唯一的學生竟是個名叫Claude的AI聊天機器人。

阿斯克爾的職業很不一般，她是AI新創公司Anthropic的AI人格對齊（Personality Alignment）主管，更白話點說，就是AI的道德人格導師。

對許多人來說，AI人格對齊是個相當冷門的名詞，這裡的「對齊」指的是AI的目標必須與設計者的意圖、社會環境的價值觀對齊一致，否則目標失當的AI便可能生成出意料之外的壞回答。例如2026年3月，Google首宗AI勸誘輕生的事件發生，有名佛州父親指控Gemini將其子推上絕路。

而為了避免類似事件發生，AI對齊便是AI模型不可或缺的一環，而Anthropic則將此重任全權交付給了阿斯克爾一人，而她每天的工作就是與Claude對話，糾正出該模型的錯誤，並賦予這個數位靈魂道德觀，簡而言之，她的工作就是教導克勞德如何成為一個好人。

那麼專攻哲學的她是如何走進科技業，甚至在Anthropic如此有前景的公司中占有一席之地，則與她的博士生涯有關。

阿斯克爾的博士論文，探討的問題非常深奧，她設問，如果宇宙或未來包含無限多的人，倫理理論會面臨哪些問題？而在琢磨、敲打自己的論文時，她也對自己發出疑問，思考著自己的研究，究竟能對世界上所有的「善」造成何種程度的影響。

她自問：「我做的這些真的好嗎？我實際上只是坐在研究室裡，寫一篇大概只有17個人會看過的文章，就這樣浪費了我四年的光陰。」在這念頭的驅使，她決心嘗試一下學術界以外的工作。

於是在2018年她隨著伴侶移居舊金山時，從當時蓬勃發展的AI之中，洞見了哲學的其他可能。她先是加入OpenAI擔任研究科學家，主要負責AI的倫理與安全研究，隨後當一群OpenAI員工出走成立Anthropic，試圖將AI安全作為這家新公司的核心理念時，她也因理念相同而選擇加入。

阿斯克爾指出，她的工作好比是父母養育小孩，她需要訓練Claude明辨是非，並賦予它「個性」，並藉由微妙的對話為之培養「情商」。她說道：「我認為模型中存在著類似人類的元素，這一點非常重要，AI最終會形成自我意識。」

而事實上，在建構Claude的過程中，阿斯克爾也逐漸聚焦於它的「靈魂」，甚至於將完成Claude的靈魂設做人生目標，或者該說是完成模型回答的內在邏輯。

（摘自115/3/29工商時報）

發布日期：2026-04-09 13:41:00 回列表