0221056

工具機主軸熱變位預測技術

Thermal Displacement Prediction Technology of Machine Tool Spindle

盧亦軒、劉德葳、洪茂棋、蔡孟勳

Yi-Synan Lu, Te-Wei Liu, Mao-Qi Hong, Meng-Shiun Tsai

一般而言,CNC 工具機以達到高速高精度為目標,影響加工精度方面原因很多,其中熱變位的影響約佔了整體誤差的 50% 以上。因此,預測熱變位以及進行補償就成為工具機達到高精度的重要因素之一。本文首先量測在不同主軸轉速工況下,各鑄件的溫度變化趨勢以及刀尖點與平台之間相對位移量,接著建立一套溫度計的排序與篩選機制,找出關鍵的溫度量測點,最後透過類神經網路建立機台主軸的熱變位補償模型,用於驗證本文建立之溫度計排序與篩選機制,並能提高熱變位補償模型的預測精度。

In general, CNC machine tools aim at achieving high speed and high precision. There are many factors in affecting machining accuracy and the influence of thermal displacement accounts for more than 50% of the overall errors. Therefore, predicting thermal displacement with compensation algorithm becomes one of the important factors for high precision of machine tools. This paper first measures the temperature changes of each casting components and the relative displacement between the tool tip point and the platform under different spindle speed conditions. Then a sorting and screening mechanism of the thermometer is established to determine the key temperature measurement points. Finally, the thermal displacement compensation model of the machine spindle is developed by using the neural network. It is used to verify the thermometer sequencing and screening mechanism established in this paper, and it is proved that the mechanism can improve the prediction accuracy of the thermal displacement compensation model.

一、前言

由於機台各部件的發熱會造成鑄件甚至機台整體結構產生變形因而影響刀尖點的定位,如何降低熱變位誤差或如何補償一直是工具機追求高精度加工急欲解決的問題,在產業界上目前熱溫補技術仍以日本 OKUMA 為代表,其他廠商仍是以結構設計、熱隔離或是加強冷卻系統等主動式抑制為主,而在文獻(20) 之中,則可以了解工具機熱變位的眾多主動式補償方式,以及不同補償方法結果的比較。

而學界方面 Li 等人(2) 的回顧論文中做了詳盡的整理以及分析,從早期透過多元線性迴歸模型 (multiple regression model)(25) 到後來使用有限元素法或是有限差分法來分析(23, 24),但仍因為在邊界條件的建立、熱傳參數的鑑別以及材料特性的設定都有其不確定性存在,以至於近年來學者們廣泛的應用類神經網路進行建模,Ali(4) 與 Huang(16) 則分別使用灰色神經網路 (grey neural network, GNN)、人工神經網路 (artificial neural network, ANN)、倒傳遞類神經網路 (back propagation neural network, BPNN) 與長短期記憶網路 (long short term memory network, LSTM) 針對主軸與滾珠導螺桿的熱變位進行分析與預測。

而不管建立什麼模型,在進行模型訓練前都必須透過一連串的數據前處理與特徵萃取,避免模型產生過度擬合現象並提升有效地模型的訓練速度與提高預測精度,其中,在文獻(15) 對資料前處理一書中,提到若像熱變位補償中溫度與位移量為不同維度以及不同單位的資料,在建立模型前必須先對資料做正規化 (normalization) 處理。而 Li 等人(9) 則透過對輸入模型的溫度資料,先做了主成分分析 (principal component analysis, PCA) 處理,使模型預測更加精準。Liu 等人(6) 透過計算各溫度量測點與熱變位的相關度,將相關度較低的量測點視為與熱變位較無關聯並將之去除,來達到溫度計篩選的目的。Zhou 等人(7) 則是經由群聚計算將溫度量測點進行分群,並作為模型輸入源。Cheng 等人(8) 則是使用皮爾森相關係數 (pearson correlation) 計算溫度量測點與熱變位間的相關度,在根據其相關度使用群聚計算來做篩選。

而相較於上述眾多文獻,本文提出了兩階段的溫度篩選機制,首先第一階段主要為透過斯皮爾曼相關係數 (Spearman correlation),分別計算出溫度量測點與位移資訊之間的線性相關程度,以及各溫度點彼此間的關聯性,將重複性過高的溫度點淘汰,完成初步的溫度篩選與排序。第二階段則為抽取部分數據做為 AI 模型的校驗集,將上述排序後的溫度資訊逐一導入模型中,進行遞增建模,並以預測的均方根誤差為基準,消除導致使預測誤差增加的溫度點,最後將篩選後的溫度點,作為 AI 模型的輸入源,驗證此排序與篩選制度能有效提高模型的預測精度。

二、主軸熱變位量測實驗

為了能模擬機台在不同主軸轉速下各元件的溫度變化與各軸向熱變位的關係,本文設計了一系列的主軸運轉實驗的工況條件,如圖 1 所示。本實驗機台的主軸最高轉速為 15,000 RPM,為了因應實際加工情形,轉速比例由 25%、50%、75、90% 與 100%,隨機分布在工況上,並且在運轉後依據轉速的高低,規劃從半小時到四個小時不等的冷卻停止時間,整體實驗總共進行了 63 小時。

圖 1. 實驗轉速工況圖。

本文主要使用國產的三軸銑床作為實驗載具,溫度量測部分,主要使用 OMEGA TT-E-36-SLE 熱電偶在機台上佈置 16 個溫度點,並搭配 NI-9174 CompactDAQ USB 機箱與 NI-9213 熱電偶擷取卡來量測機台各部位的溫度變化,而量測點佈置的位置如下圖 2 所示,而其所布置的位置表,如表 1 所示。

圖 2. 溫度量測點佈置圖。

表 1. 溫度量測點編號及所在位置。

接著為了測量平台的相對位移和主軸末端效應,透過特製的測量棒與設計了一特殊的夾具固定 KEYENCE 非接觸式渦電流位移感測器的搭配進行同步量測,取得在不同主軸轉速工況下,各鑄件的溫度變化趨勢以及刀尖點與平台之間的 X、Y 和 Z 方向的相對位移量,如圖 3 所示。總共五個位移傳感器固定在夾具上,其中兩個安裝在 X 軸上方向,兩個在 Y 方向,一個在 Z 方向。

圖 3. 位移計架設方式。

三、溫度計分析與排序

在建立熱變位預測模型前,必須先確立模型所需使用的輸入以及輸出訊號,而主軸的熱變位,可以將其視為單一軸向的熱變位,由一維線性熱膨脹方程式可得式 1。

其中,DL 為溫升所造成的主軸熱變位量,a 為線性熱膨脹係數,L0 為主軸的初始長度,DT則是主軸本身及周遭所產生溫度變化,因此根據上式可得知,主軸的熱變位與溫升變化成正比的關係,因此熱變位模型的輸入訊號應為各溫度量測點的溫升,而輸出則為各軸向的熱變位量。而在大多數的文獻中,機台皆在恆溫室進行量測實驗,因此能將環境溫度當成溫升的基準,而本次實驗並未對環境溫度多做限制,環境溫度是隨著時間不斷在變化的,因此無法成為基準。然而若從 16 個溫度量測點,將每個溫度量測點的初始溫度當作是個別的基準點,則整個預測模型將產生 16 個不同的溫度基礎點,使得溫度基礎點不一致。為解決上述的問題本實驗從 16 個溫度點中,找出一溫度變化趨勢最小的量測點,當作溫升基準點。

在建立溫度與位移的關係後,而 Li(2) 等人曾提及,在建立熱變位預測模型時,可以將一些非溫升的實驗數據,例如主軸轉速與馬達電流等,也納入預測模型的輸入數據,增加模型的預測能力。從圖 1 與圖 4 中可看出,在進行不同轉速時時,位移變化是非常明顯且即時的,相較之下溫度變化是較為緩慢的。因此,選擇將主軸轉速整合輸入數據之中,希望其能夠幫助預測不同轉速時的位移變化量。但主軸轉速以及溫升數據的單位以及維度皆不相同,在訓練過程中會造成熱變位預測模型無法收斂,因此需針對輸入資料做正規化(17) 處理,消除其單位及維度不相同的影響。

圖 4. 各軸向位移變化圖。

圖 5. 機台立柱與主軸的溫度變化圖。

圖 6. 機台鑄件與底床溫度變化圖。

式 (2) 的矩陣,I 為模型的輸入矩陣,其中 m 為資料的樣本數,n 為資料的特徵數。

首先分別計算出原始數據 I 的平均值 Uj 與標準差 Sj

最後即可將輸入矩陣做正規化運算,得到一新矩陣。

在完成數據前處理後,必須建立一套溫度計的排序與篩選機制,找出關鍵的溫度量測點,當作適當的模型輸入源,此舉不僅能防止感測器的過度安裝且能在減少模型訓練時間的同時,有效地提升模型的預測精度。

本文所使用的篩選方法主要為透過斯皮爾曼相關係數 (Spearman correlation),而斯皮爾曼相關係數,通常用於呈現兩組變數之間的關聯性,計算兩組變數之間的非線性相關度。與一般常見的皮爾森相關係數 (Pearson correlation) 相比,比較不受離群值的影響,也不需要滿足數據必須要是常態分佈的先決條件,計算所得的相關係數值會落在 ±1 之間,而數值越接近 0 代表相關度越小。

首先通過計算溫度點互相的關係數來獲得兩個溫度訊號的相關性。當相關係數大於 0.99 時,則將其中一溫度點刪除。此舉會將原始的 16 個溫度點減少至 11 個溫度點,接著對其餘 11 個溫度點進行排序。排序規則基於溫度點和 Z 方向上的熱變位之間的相關係數。如果相關係數較高,則代表溫度訊號與位移訊號非常相似。相關係數的計算結果和順序,如表 2 所示。

表 2. Z 軸初步篩選結果。

最後找尋不適合訓練模型的溫度點,即為如果將此溫度點添加到訓練集中,則可能導致預測的誤差增加。首先將其中的 168 筆,約為全部數據 10% 當作校驗集,透過逐漸增加建模中溫度點的數量,來消除導致預測誤差增加的溫度點,結果如圖 7 所示。圖中 X 軸表示溫度點的數量,Y 軸表示模型預測的均方根誤差 (root mean square error, RMSE)。第一個長條數據僅使用表 2 中的第一個溫度點主軸鑄件的前端下方。RMSE 誤差約為 8.3 mm。第二個長條則表示使用表 2 中前兩個溫度點的結果。從圖 7 中可以看出,添加表 2 中的第三、第四、第五和第十一溫度點可能會導致預測 RMSE 誤差增加,故消除了以上溫度點。

圖 7. 溫度校驗集的 Z 軸預測誤差。

四、類神經網路預測模型

在對主軸的熱變位做補償前,首先必須先建立一個熱變位預測模型。而當今在熱變位預測模型當中,大致上可分為三個種類 : 多元線性迴歸分析、最小平方法分析以及類神經網路預測模型。在以上三者之中,多元線性迴歸分析算是其中使用最為普遍的。然而多變數回歸分析雖然建模速度快,不過卻無法完整模擬熱變位之非線性特性。而類神經網路,不僅能夠建構非線性的模型,並且與多變數回歸分析相比,能夠有較佳的預測精度。因此,本研究選擇使用類神經網路模型建立熱變位預測模型。

人工類神經網路 (artificial neural network, ANN),是一個可以模擬人類思考、運算、學習的數學模型,它由許多的神經元所組成,並將其之間做相連,來模仿生物神經網路的能力。而類神經網路的優點,則是它可以充分的逼近任意複雜的非線性問題,並且也有較高的強健性以及容錯性,而在本章將會介紹類神經網路的基本理論,以及本文所用來建立熱變位預測模型的兩種類神經網路。

人工神經元 (artificial neuron),是組成類神經網路的基本元素,也是其中最小的處理單元。每一個神經元的輸出值,將成為其他許多神經元的輸入,類神經網路的架構,基本上可以分成三個層次,分別是輸入層、隱藏層及輸出層。由一些相同作用的神經元能構成「層」,而將這些擁有不同作用的層則組成了網路,類神經網路架構圖,如圖 8 所示。

輸入層 (input layer) : 從外界接收訊號,並將此訊號導入類神經網路之中,以進行訊號處理。

隱藏層 (hidden layer) : 接受輸入層的訊號,對訊號進行處理,每一層的神經元皆有和相鄰層的神經元連結。

輸出層 (output layer) : 接收網路處理後的訊號,並把結果輸出到外界。

圖 8. 類神經網路基本架構(22)

1. 一般迴歸神經網路

一般迴歸神經網路 (general regression neural network, GRNN),屬於監督式學習網路的一種,其是由機率神經網路 (probabilistic neural network, PNN) 所發展而來。GRNN 改善了機率神經網路只能處理分類方面的問題,增加了能夠處理連續變數的能力,使模型能處理線性及非線性的迴歸問題,而其模型的特性皆為建立熱變位預測模型所希望具備。

在一般迴歸問題裡,假設因變數 Y 代表系統的輸出值,自變數 X 代表系統的輸入值。而 f(x , y) 為一個已知向量隨機變數 X 和隨機變數 Y 的聯合機率密度函數,令 x 為隨機變數 X 中的一個特殊觀測值,則 YX = x 上的條件期望值可以用式 (7) 表示:

但若 f(x , y) 為未知,則必須從變數 XY 中的樣本觀測值進行估算,而 Specht(11) 等人則透過 Parzen window 的方法來估測 f(x , y),其中(x , y) 即為以樣本值 xj 以及 yj 來估計出的機率函數,而 n 為樣本數,p 為向量變數 x 的維度。

將上式 (7) 以及 (8) 合併並整理後,可得下式 (9):

其中 s 為平滑參數 (smoothing parameter),為一個大於 0 的常數,也是 GRNN 唯一需要用學習方式決定的參數。而式 (9) 可再簡化為式 (10):

  

GRNN 的架構如圖 9 所示,其中輸入單元 (input units) 為分配的單元,它的作用是把所有 x 的數值分配給第二層的型態單元 (pattern unit),每一個型態單元代表一個訓練範例,當有一個新的 x 向量進入網路後,此向量減去訓練範例的向量,兩者差的平方值會被加總並輸入到非線性的作用函數。

圖 9. GRNN 模型架構(11)

2. 長短期記憶

機台的溫度訊號及位移訊號,皆屬於有時間序列關係的資料,若使用傳統的類神經網路架構則無法完美的擷取到前後時間資料的關聯性,而遞迴神經網路 (recurrent neural network, RNN) 則解決了這個問題,其能夠處理有時間序列關係的資料。

遞迴神經網路相較於過去的類神經網路模型,捨棄了傳統的前饋神經網路 (feedforward neural network) 架構,使用了回饋式結構,使輸入隱藏層的資料,不僅包含當前輸入層的數據狀態,也包含了過去時間點的輸出結果,使其利於表達跟時間相關的動態行為。

根據圖 10 中,X 代表為輸入層、S 為隱藏層、O 為輸出層,UV 為權重,W 為隱藏層中,將權重值從前一個時間點傳遞至下一個時間點,不過隨著時間推演,較為早期的輸入資料,在資料不斷傳遞的過程當中,影響力是不斷在衰減的,導致模型難以學習長時間資料的關係,此現象稱做梯度爆炸。

圖 10. RNN 基本架構(26)

為解決梯度爆炸的問題,長短期記憶 (long short-term memory, LSTM) 的架構因此被提出,其對 RNN 隱藏層的架構進行改善,引入了記憶細胞 (memory cell) 以及閘門 (gate) 的概念,它具有三種階段:包括忘記階段、選擇記憶階段和輸出階段。通過以上三階段的運算, LSTM 可以處理長時間序列的迴歸問題,在忘記階段,它將輸入乘以忘記函數,從而減少了不重要的輸入功能的影響;相反的,在選擇記憶階段則將重要功能傳送至輸出階段。

圖 11 為一簡單的 LSTM 模型架構圖,其中 zfzizo 分別代表為忘記閘門 (forget gate)、輸入閘門 (input gate) 以及輸出閘門 (output gate)。zfzizo 向量乘以相對應的矩陣之後,將透過一 sigmoid 激活函數將數值轉換為 0 到 1 之間,來做為閘門的狀態。而 z 則是利用一 tanh 激活函數,將其轉換成 ±1 之間的值,作為輸入數據。

圖 11. LSTM 模型架構(23)

忘記階段:利用忘記閘門 zf,將上一個時間點所傳進的輸入 ct-1 進行選擇性忘記,留下對模型重要的資訊。

選擇記憶階段:利用輸入閘門 zi,對這個階段的輸入資訊 xt,有選擇性的記憶。而當前輸入內容,由式 (13) 計算得到的 z 表示。再將此兩個階段的結果相加,即可以傳遞給下一個狀態的 ct

輸出階段:最後此階段主要通過輸出閘門 zo 進行輸出資訊控制。

五、熱變位預測結果

首先為了訓練和評估模型的正確性,將 1680 筆數據分為兩個部分:第一部分為占 75% 數據量的 1260 筆數據作為訓練集,而剩餘 25% 的 420 筆數據作為測試集。輸入數據為 16 個溫度資訊和主軸轉速,總共有 17 個訊號,輸出訊號是渦流位移感測器在 Z 方向上測得的平台和刀尖的相對位移量。並使用上章節介紹的兩種類神經網路模型建立熱變位預測模型,期望能根據比較各模型的預測結果來挑選出適當的熱變位預測模型。

圖 12 分別為使用 LSTM 預測模型所得到的 Z 軸真實與預估熱變位量以及補償前後的比較圖。

圖 12. LSTM 模型預測誤差。

圖 13 分別為使用 GRNN 預測模型所得到的 Z 軸真實與預估熱變位量以及補償前後的比較圖。

圖 13. GRNN 模型預測誤差。

表 3 為 LSTM 以及 GRNN 模型所得到的預測結果比較,可以看出不管是整體的趨勢、測誤差連誤差範圍 LSTM 模型都是優於 GRNN,故在後續建立熱變位預測模型時,將選擇使用 LSTM 類神經網路模型。

表 3. LSTM 與 GRNN 模型預測比較。

根據上述篩選所得的溫度量測點與轉速當作是模型之輸入數據,導入至 LSTM 訓練模型中,利用占 75% 數據量的 1260 筆數據作為訓練集,建立 Z 軸方向熱變位預測模型,最後扣除用來篩選的 10% 校驗集資料,將剩下 15% 的 252 筆數據設定為測試集資料來驗證模型。

從圖 14、圖 15 與表 4 中可以看出,溫度點的數量從 16 個減少到 7 個,而預測 RMSE 也從 4.29 mm 減少到 1.57 mm。

圖 14. 溫度篩選前 Z 軸預測熱變位及預測誤差。

圖 15. 溫度篩選後 Z 軸預測熱變位及預測誤差。

表 4. Z 軸向篩選前及篩選後預測比較。

六、結論

本文採用兩種不同的類神經模型來預測熱位移,相較之下 LSTM 模型在預測中比起 GRNN 不管在誤差範圍或 RMSE 方面都擁有較佳的預測結果。而為了減小溫度訊號的數量並提升模型運算效率,本文提出了一個溫度點排序與篩選的機制,首先透過計算溫度點和熱位移之間的相關係數,消除相似的溫度點,進而避免產生過度擬合現象,接著逐一增加訓練模型的溫度點數量,可以觀察出不適合訓練模型的溫度點會使預測誤差增加,因此也將其移除。通過以上的篩選機制,溫度點可以從 16 個減少到 7 個,進而使 LSTM 模型的訓練時間減少 56.9%,且與使用所有溫度點的預測模型相比,RMSE 從 4.29 mm 減少到 1.57 mm。