作者 | David Linthicum
策劃 | 言征
從數據可用性、安全性到模型選擇和監控,生成式AI的加入便意味著要重新審視云架構。 所以,如果在構建一個云架構同時也在設計生成式AI驅動的系統。你需要做哪些不一樣的改變?還需要做什么?目前出現了哪些最佳做法? 結合過去20年的經驗,以下是作者給出的一些建議,整理如下,望諸位有所啟發。
1、理解你的用例
明確定義云架構中生成人工智能的目的和目標。如果我反復看到任何錯誤,那就是沒有理解商業系統中生成人工智能的含義。了解您的目標是實現什么,無論是內容生成、推薦系統還是其他應用程序。這意味著寫下內容,并就目標、如何實現目標以及最重要的是如何定義成功達成共識。這對于生成人工智能來說并不新鮮;這是贏得每一次遷移和構建在云中的全新系統的一步。
我看到許多云中的整個生成AI項目都以失敗告終,因為它們沒有很好地理解業務用例。公司制造了一個很酷的東西,但不會給業務帶來任何價值。這是行不通的。
2、數據來源和質量是關鍵
識別生成人工智能模型訓練和推理所需的數據源。數據必須是可訪問的、高質量的,并經過仔細管理。您還必須確保云存儲解決方案的可用性和兼容性。生成型人工智能系統高度以數據為中心。我稱之為面向數據的系統;數據是推動生成性人工智能系統產生結果的燃料。垃圾進,垃圾出。
因此,將數據可訪問性作為云架構的主要驅動因素是有幫助的。您需要將大多數相關數據作為訓練數據進行訪問,通常將其保留在現有位置,而不是將其遷移到單個物理實體。否則,你最終會得到多余的數據,沒有單一的真相來源。
在將數據輸入人工智能模型之前,考慮高效的數據管道來預處理和清理數據。這樣可以確保數據質量和模型性能。這大約是使用生成人工智能的云架構成功率的80%。然而,這一點最容易被忽視,因為云架構師更多地關注生成人工智能系統的處理,而不是為這些系統提供數據。數據就是一切。
3、數據安全和隱私
正如數據很重要一樣,應用于數據的安全性和隱私性也很重要。人工智能的生成處理可以將看似毫無意義的數據轉化為可以暴露敏感信息的數據。
實施強有力的數據安全措施、加密和訪問控制,以保護生成人工智能使用的敏感數據以及生成人工智能可能產生的新數據。至少要遵守相關的數據隱私法規。這并不意味著在你的架構上安裝一些安全系統作為最后一步;安全性必須在每一步都融入到系統中。
4、可擴展性和推理資源
規劃可擴展的云資源,以適應不同的工作負載和數據處理需求。大多數公司都考慮自動擴展和負載平衡解決方案。我看到的一個更重大的錯誤是構建規模良好但成本高昂的系統。
最好平衡可擴展性和成本效率,這是可以做到的,但需要良好的架構和finops實踐。此外,檢查訓練和推理資源。我想你已經注意到,云會議上的許多話題都圍繞著這個話題,這是有充分理由的。選擇具有GPU或TPU的適當云實例進行模型訓練和推理。再次,優化資源分配以提高成本效率。
5、考慮模型的選型
根據您的具體用例和需求,選擇示例性的生成AI架構(通用對抗性網絡、轉換器等)。考慮用于模型培訓的云服務,如AWS SageMaker和其他服務,并找到優化的解決方案。這也意味著要理解你可能有許多相互關聯的模型,這將是常態。
實施穩健的模型部署策略,包括版本控制和容器化,使AI模型可供云架構中的應用程序和服務訪問。
6、監控和日志記錄
設置監控和日志系統以跟蹤AI模型性能、資源利用率和潛在問題不是可選的。建立異常警報機制,以及為處理云中生成人工智能而構建的可觀察性系統。
此外,持續監控和優化云資源成本,因為生成式人工智能可能是資源密集型的。使用云成本管理工具和實踐。這意味著讓finops監控部署的各個方面——最低限度的運營成本效率和評估架構是否最佳的架構效率。大多數體系結構都需要調整和持續改進。
7、其他考慮
需要故障切換和冗余來確保高可用性,災難恢復計劃可以在系統故障時最大限度地減少停機時間和數據丟失。必要時實施冗余。此外,定期審計和評估云基礎設施內生成人工智能系統的安全性。解決漏洞并保持合規性。
制定人工智能道德使用指南是個好主意,尤其是在生成內容或做出影響用戶的決策時。因此,需要解決偏見和公平問題。目前有關于人工智能和公平的訴訟,你需要確保你做的是正確的事情。持續評估用戶體驗,以確保人工智能生成的內容符合用戶期望,并提高參與度。
無論你是否使用生成人工智能,云計算架構的其他方面都是一樣的。關鍵是要意識到,有些事情要重要得多,需要更加嚴格,而且總有改進的空間。
參考鏈接:https://www.infoworld.com/article/3706094/adding-generative-ai-systems-may-change-your-cloud-architecture.html