深圳2020年7月15日 /美通社/ -- 近期,大巖資本成立七周年慶在深圳成功舉辦。周年慶上量化投資基金經理黃鉑博士結合生活實踐中的案例,深入淺出闡釋了最優(yōu)化算法的前世今生。
從實際生活中最基礎的應用切入,黃鉑博士將抽象的算法概念生動化,解釋了什么叫最優(yōu)化問題、凸優(yōu)化及算法分類、機器學習與人工智能應用。
黃博士的分享內容較長,我們將分上、中、下三篇連載推出,本文為上篇。
最優(yōu)化問題及基礎應用
人生不如意之事十之八九,想達到我們想要達到的目標時,通常都有各種各樣的限制。那么所謂最優(yōu)化問題,就是指用最優(yōu)的方式去平衡理想與現實之間的關系。以簡單的郵差送信問題為例,郵差從A出發(fā),送信到BCD,最后回到A。郵差每天必須經過BCD,而且每個點每天只能經過一次,在這樣的約束條件下,他的目標函數是盡可能以最短的時間完成送信。這個問題非常簡單,只要把所有的路徑枚舉出來,然后取最短時間的方式即可。
根據前面的例子,我們嚴格的將目標函數分為兩大類。第一類是最大化,包括最大化盈利,最大化效率。另一類是最小化,包括最小化費用、時間和錯誤率。在金融行業(yè),我們可以最大化預測股價的正確率,也可以最小化費用、最小化時間和錯誤率。當然,我們可以同時最大化盈利,最小化費用和時間。所以通常在很多的優(yōu)化問題中,這兩種任務可以組合起來出現在同一個問題框架下,這就是對于目標函數的定義。
最優(yōu)化問題的兩大類:連續(xù)優(yōu)化與離散優(yōu)化
關于約束條件,理想很美好,現實很骨感,在現實生活中,我們會遇到比如預算有限、時間有限、外部強制性條件等各種各樣的問題,與目標函數一樣,這些限制條件不是單一存在的,也可能同時存在同一個問題里,對于某一個優(yōu)化問題來講,限制條件越復雜,求解就越困難?;诖?,我們簡單根據它的約束條件以及目標函數變量類型將最優(yōu)化問題分成兩大類,連續(xù)優(yōu)化和離散優(yōu)化。
連續(xù)優(yōu)化正如圖上所畫,線中間沒有斷點,而離散優(yōu)化的變量取值,是一個不連續(xù)的記錄,就如同一開始講的郵差送信問題。兩類相較而言,離散優(yōu)化會更難解決,因為離散優(yōu)化多了一條限制條件 -- 不連續(xù)的集合。很多時候,我們要求我們的變量是一個整數,或者來自一個給定的區(qū)間,所以說離散優(yōu)化會比連續(xù)優(yōu)化更難解,而兩種算法也會有非常大的不一樣。
從學術角度而言,連續(xù)優(yōu)化與離散優(yōu)化對應的是兩個比較獨立的學科,離散優(yōu)化可能更多的應用于統(tǒng)計、大數據相關的場景,連續(xù)優(yōu)化則會跟計算機密碼學相關,更多的與我們現實生活中的運籌優(yōu)化應用相關。
從目標函數出發(fā),它的最優(yōu)值也分為兩類,局部最優(yōu)和全局最優(yōu)。我們看圖中黃色的點,在局部區(qū)域內是最低的,我們管這個值叫做局部最優(yōu)值,但是當我們看整個圖時,紅色的點才是最低的,所以這個點我們叫全局最優(yōu)值。通常來說,取局部最優(yōu)值是相較容易的,因為基本上你只需要看它臨近一小部分的信息就可以準確判斷是否局部最優(yōu),而在現實應用中,其實僅僅知道局部最優(yōu)值就足以解決很多問題。而更難的問題在于全局最優(yōu)值,因為前提是你需要看到整個畫面。
所以,對于這一類問題,我們目前沒有一個特別好的解決方法?,F實生活中,我們會有比較多的方法去求局部最優(yōu)值,而往往我們找到的幾乎跟實際上的全局最優(yōu)值不一樣。但有一個問題是例外,這類問題它具有比較好的性質,只要找到局部最優(yōu)值,它就肯定是全局最優(yōu)值,這類問題就叫凸優(yōu)化。(未完待續(xù))