購買設(shè)計請充值后下載,,資源目錄下的文件所見即所得,都可以點開預(yù)覽,,資料完整,充值下載可得到資源目錄里的所有文件。。。【注】:dwg后綴為CAD圖紙,doc,docx為WORD文檔,原稿無水印,可編輯。。。具體請見文件預(yù)覽,有不明白之處,可咨詢QQ:12401814
南 京 理 工 大 學(xué) 紫 金 學(xué) 院
畢業(yè)設(shè)計(論文)外文資料翻譯
系: 機械工程系
專 業(yè): 機械工程及自動化
姓 名: 劉學(xué)偉
學(xué) 號: 060104212
外文出處:Neurocomputing 72 (2009) 3624–3630
附 件: 1.外文資料翻譯譯文;2.外文原文。
指導(dǎo)教師評語:
簽名:
年 月 日
注:請將該封面與附件裝訂成冊。
附件1:外文資料翻譯譯文
新興的運動特性:學(xué)習(xí)鉸接式移動機器人中關(guān)節(jié)的協(xié)調(diào)性
Diego Pardo,Cecilio Angulo,Sergi del Moral, Andreu Catal_a
CETpD,技術(shù)研究中心,ESAII-UPC,自動控制系,加泰羅尼亞技術(shù)大學(xué)、VilanovailaGeltr′u, 巴塞羅那,西班牙
關(guān)鍵字:
鉸接式移動機器人
運動特性
機器人的學(xué)習(xí)
摘要
在這篇文章中,我們分析評價鉸接式移動機器人運動特性一般方法背后的意義而這種鉸接式移動結(jié)構(gòu)處于折衷動態(tài)平衡下,針對這些問題,我們提出了新的方法和方法論,而此方法論描述了機器人運動時關(guān)節(jié)的運動特性,除了常見的方法,我們還假定解決方法中運動信息的有效性,但其不涉及工作區(qū),控制結(jié)構(gòu)根據(jù)當(dāng)?shù)仃P(guān)于關(guān)節(jié)加速度標準來確定控制策略,使驅(qū)動自由度達到理想結(jié)構(gòu)。同時,得到的非驅(qū)動自由度狀態(tài)被看作是這種策略的間接性概述,控制策略圍繞施加的簡單基元進行參數(shù)化的控制,通過改變參數(shù)的方法實現(xiàn)變形,這種方法是最優(yōu)的。通過隨機算法去實現(xiàn)對非驅(qū)動自由度的控制,從而達到理想的運動特性。
1.導(dǎo)言
鉸接式移動機器人是一種自主系統(tǒng),這些系統(tǒng)的功能允許系統(tǒng)的類型有多樣話的運動特性,但對這些特性也加以限制。它的初始示例是由機器人比賽提供的,其中的標準機器人用來踢足球。研究小組嘗試通過給定的運動學(xué)和動力學(xué)結(jié)構(gòu)使產(chǎn)生的運動特性更好,如:跑,踢,頭球和守門。因此,改善運動特性的性能是一項挑戰(zhàn)。然而,一些問題是:(i)機器人的高效或速度不夠快是默認步態(tài)嗎?(ii)機器人能跳嗎?(iii)機器人能舉起超過限重的重量嗎?因此,設(shè)計新的運動特性和克服身體本身的約束和限制是一項挑戰(zhàn)性的問題。
鉸接式移動機器人是一種非驅(qū)動系統(tǒng),不是所有的自由度都被驅(qū)動,因此普遍的動平衡系統(tǒng)不斷遭到破壞。另外,它們也是多余的,比起那些象征意義上的機器人的控制元件有更多的自由度。如何去控制這一類型的機械裝置是不明顯的,這些對于研究機器人來說一直都是開放的領(lǐng)域。我們在這篇文章中找到了鉸接式機器人的人工合成方法,明白了運動特性是人們對機器人結(jié)構(gòu)和結(jié)論的解釋說明。
為了限制一些問題,我們會集中討論可能通過的其余部分的運動實現(xiàn)運動特性的編碼,運動由初始狀態(tài)和最終狀態(tài)等于零時定義,盡管如此,大多數(shù)鉸接式機器人的運動特性還是可以理解為一系列的間隙性運動,例如:伸出,拋和簡單的姿態(tài)轉(zhuǎn)變。此外,循環(huán)和組成的過程可以被分解成這種類型的動作序列。
文獻[9]中研究有關(guān)工作區(qū)機器人的運動學(xué)和剛體動力學(xué),但其實現(xiàn)的條件通常是建立足夠的理論特性上。當(dāng)合適的加速度被用來實現(xiàn)運動時,重力可以忽略不計,因此,機器人的能量消耗是人步行過程中所需能量的15倍,然而,它已經(jīng)被證明當(dāng)人步行時重力不是總是可以忽略不計而且重力是實際存在的。看來前面所給定的運動特性目前的解決方案只適合于在一個特定的情況。因此,解決問題的方案是縮小理論的使用范圍而不是由機器人的性能來決定的。
然而,一些結(jié)果表明采用新的方案也可以解決問題,也證實了新方案的可行性同時新方案還能增強機器人的性能。例如,在文獻[19]中寫到,在探索新領(lǐng)域解決方案時用合適的方法可以很大地提高工業(yè)機械手的最大負載。用參數(shù)化地手段制定最佳控制方法來解決自身動力學(xué)和時間范圍的限制。與以往的步驟有所不同,該控制方法導(dǎo)致機器人更加容易操縱,沿著同樣的思路,一個相似的結(jié)論不久就出現(xiàn)在文獻[15]中,文獻中提到一個簡單的二維三自由度的機器人能夠完成舉重的動作,這樣能避免機器人工作時被局部化地限制。它除了最大化解除負載外,還能完全地用其他方式來完成同樣的動作。以上兩種方法都是直接聯(lián)接在運轉(zhuǎn)和扭矩命令之間,工作區(qū)所需的必要條件幾乎為零,這樣系統(tǒng)能夠更自由地結(jié)束運轉(zhuǎn)。兩種方法都被最有效地作為主要途徑使用。
最近,越來越多地把注意力放到了學(xué)習(xí)開發(fā)機器人性能的領(lǐng)域。最新的期刊刊登的都是圍繞著早期仿制機器人,這些機器人的工作區(qū)都是屬于人為的,隨后,機器人關(guān)節(jié)都是通過一些參數(shù)的設(shè)計來控制的,這就是所謂地動力控制系統(tǒng)。大多數(shù)RL算法同樣適用于計算機控制機器人,此控制政策已經(jīng)在文獻[13]中寫到。
在作者寫的這篇文章中,我們假設(shè)所得到的運動學(xué)初期和末期的信息是相同的,我們的控制準則是建立在當(dāng)?shù)仃P(guān)節(jié)變速水平的基礎(chǔ)上,使驅(qū)動自由度達到最終的理想狀態(tài)。同時,非驅(qū)動自由度的最終形態(tài)以驅(qū)動自由度的分布圖的形式畫出來。用作加速控制器提供所需的系統(tǒng)屬性控制DSs。
隨后,我們在這篇文章中提供了相關(guān)問題實質(zhì)性的描述。站立運動特性表明那些非驅(qū)動系統(tǒng)的運動特性的動力平衡問題是可以調(diào)試的。圖一顯示了起初和最終的運動狀態(tài)。其中特別提到了它的運動特性是初速和最終速度都等于零的運動過程。機器狗開始是躺倒的姿勢,隨后將會站立并以圖1-b所示的動作結(jié)束。然而重力和其他非線性運動可能會讓機器狗以不同的方式結(jié)束運動,如圖1-c所示。
(a)起初機器狗將要站立 (b)期望的站立方式 (c)站立失敗
圖1
我們在第二章節(jié)寫了基本的定義和正規(guī)的公式化問題。接著,在第三章節(jié)中提到了計算操作器的方法論。在第四章節(jié)中,應(yīng)用這些方法論展示機器人模仿人的運動特性。最終,結(jié)論都匯集在第五章節(jié)中。
2.控制機器人的運動特性
以一個參照系為基準,機器人的結(jié)構(gòu)確定了機械裝置所有部分的位置 ,機器人的結(jié)構(gòu)是由獨立位置變化的矢量q決定的, ;q定義了機械裝置自由度的數(shù)量。機器人關(guān)節(jié)之間的空隙是一組不確定值的集合,以方向和速度規(guī)定的機器人用坐標的形式表示為:。
這些機器人的結(jié)構(gòu)定義了工作區(qū),記作,。q和x的關(guān)系如下:
(1)
其中該機器人的自由度數(shù)量比x大,比操作所需的自由度數(shù)量多的多,因此顯得有些多余。
速度和加速度之間的關(guān)系可以通過對(1)式的求導(dǎo)和二次求導(dǎo)得出:
(2)
其中是的雅可比矩陣
既然,描述機器人運動的原理已經(jīng)形成了,現(xiàn)在專注于機器人的應(yīng)力,其中應(yīng)力和加速度的關(guān)系可以寫成:
(3)
當(dāng)瞬時加速度和矢量q的方向一致時,系統(tǒng)是沒有驅(qū)動力的。對于鉸接式移動機器人而言,自由度可以被看作成一個建立在機器人身上的慣性參數(shù)。
假設(shè)鉸接式機器人是不能彎曲的,它們的運動形態(tài)可以作為二階邏輯系統(tǒng)來描述,如果這樣扭矩就會影響到其它力在構(gòu)件上的相互作用。我們可以把它們之間的關(guān)系表達成:
(4)
驅(qū)動加速度自由度表示為,非驅(qū)動加速度的自由度表示為,考慮到個別特殊的情況,我們可以增強系統(tǒng)在(4)中的原動力
(5)
其中慣性矩陣被分離成,因此如上式所知,M、驅(qū)動加速度、非驅(qū)動加速度三者之間有著密切地關(guān)聯(lián)。
在用加速度等級控制驅(qū)動關(guān)節(jié)的基礎(chǔ)上采用原動力系統(tǒng)作為策略,這樣可以隨時限制加速度命令。所設(shè)計的策略讓每個關(guān)節(jié)地最終狀態(tài)都以順暢的運動方式進行,并把它的結(jié)構(gòu)形式定義為:,我們起初定義它的運動方式為:
(6)
上式表示關(guān)節(jié)的坐標有誤差時,t用i代替其速度和位置。
我們用下式定義一個局部的策略
(7)
其中是關(guān)節(jié)的理想加速度,在這里,我們假設(shè)存在一個低級控制器使理想加速度符合轉(zhuǎn)矩命令。由此得到,我們假設(shè)的驅(qū)動自由度的實際加速度就是文獻[7]中所給出的。
緊接著,我們定義下式作為基本的方法:
(8)
當(dāng)這個基本方法被使用時,有誤差的關(guān)節(jié)的位置和速度就可以表示為。當(dāng)非對角線上的額外力不等于零時,系統(tǒng)的原動力就會發(fā)生改變。
整個完整的方法一般地被定義為,它能夠完全表達出使用時間,用一種簡單的表達式:
(9)
其中矩陣,矩陣。
帶著分析機器人全身運動關(guān)節(jié)性能的目的,在文獻[5]寫到的結(jié)果對非驅(qū)動自由度的影響:一般用表示,更精確地表示成,
(10)
記下外力和力的相互關(guān)系,可以看得出,它們一起改變了機器人的運動特性。它們在影響(2)式的同時還影響機器人內(nèi)部動力的工作軌跡。
如果函數(shù)被定義為(11),那么計算機器人運動特性的問題能夠得到有效地解決。
得到:
(12)
在(7)中所提到的參數(shù)需滿足上面的的限制條件,在下一章節(jié)我們將會涉及到最佳結(jié)構(gòu)的機器人,此機器人的加速度和運動特性都是最佳的。
3.學(xué)習(xí)控制方法
找到合適的加速度是解決這一變量問題的必要途徑。我們通過測量機器人完成任務(wù)時的動作結(jié)合一些參數(shù)定義了如下式的目標函數(shù):
(13)
其中,是代表機器人在特定參數(shù)條件下結(jié)構(gòu)和運動形態(tài)的標量,在(13)中我們已經(jīng)進行了詳細地描述。我們給定機器人結(jié)構(gòu)一個最初值和最終值,結(jié)果顯示相比理想結(jié)構(gòu),最終結(jié)構(gòu)能夠有效地表示出操縱器的優(yōu)點
(14)
另外,當(dāng)非驅(qū)動自由度是一個假設(shè)的概念時,那么一個相等的目標函數(shù)就能夠算出工作矢量的實際值和理論值
(15)
這樣意味著,x必須是已知的。
如果降低函數(shù)的次數(shù)是我們的目標,那么優(yōu)化參數(shù)的計算方法可能會是降低函數(shù)次數(shù)的最佳方法,
(16)
其中,r是循環(huán)數(shù),并且。R的梯度W在寫成。我們舉一個PGRL算法的例子,梯度的隨機近似值在[4]中通過特別項的理論值被給出
(17)
其中是梯度在中的估算值,是隨機矢量,u是一個系數(shù);是參數(shù)向量的值。它在[4]中已經(jīng)介紹過,梯度的近似值導(dǎo)致集合趨于極小值。
為了解決(17),嘗試讓機器人所有關(guān)節(jié)都伸展,結(jié)果表明它只適合于單個關(guān)節(jié)的伸展。實際上,單個關(guān)節(jié)只滿足[4]中梯度的運算。在這兒我們寫了相關(guān)的計算程序
輸入:u,b,
1. 重復(fù)
2. 選擇
3. 用攝動參數(shù)完成延伸
4. 自動檢測約束構(gòu)件
5. 計算性能
6. 估算梯度向量
7. 直到梯度估算值等于
返回:梯度估算值
其中定義為梯度估算值的平均值
4.結(jié)果
在一個簡單的仿人機器人實驗中,機器人剛開始處于站立的位置,最終讓機器人伸出一條腿時保持平衡狀態(tài),圖2中是機器人運動的示意圖
(a)初始姿態(tài) (b)最終姿態(tài)
圖2
仿人機器人在移動過程中使用了四個關(guān)節(jié):左踝關(guān)節(jié),右踝關(guān)節(jié),臀部和膝蓋,b=4.(詳細地見圖3)。然而,由于仿人機器人的動力平衡條件,廣義坐標向量的數(shù)值需要確定其姿勢和方向,其中。作為在第二章節(jié)所描述的方法,每個驅(qū)動自由度都是用手工建立的。機器人關(guān)節(jié)的加速度的變化如圖4所示。在(8)中明確地用基本原理的方法形成加速度,盡管實際運動軌跡不能達到理想軌跡,但非驅(qū)動自由度的機器人能夠用一種完全不同的方式完成下蹲動作。
在第三章節(jié)中我們介紹了梯度下降的方法,把假設(shè)的自由度降到最低,緊接著就出現(xiàn)了:機器人在沒有下蹲的情況下完成了運動過程。在圖5中畫出了四個驅(qū)動自由度的速度分布圖。
(a)臀部關(guān)節(jié)
(b)踝關(guān)節(jié) (c)膝蓋
圖3
(a)左踝關(guān)節(jié)軌跡 (b)右踝關(guān)節(jié)軌跡
圖4
(a)膝蓋 (b)臀部
(c)左踝關(guān)節(jié) (d) 右踝關(guān)節(jié)
圖5:虛線為正常軌跡,實線為變形軌跡
5討論和結(jié)論
隨著鉸接式移動機器人適用性的增強,高效的處理器和適用的用戶界面,機器人正離開實驗室走進人們的日常生活中。沒有輪子的運動系統(tǒng)正被普遍地用于各種平臺。這在機器人的發(fā)展過程是中一項挑戰(zhàn)。
從機器人運動意圖的角度出發(fā),對這些運動特性進行分類。這類的運動特性包括:舉重,跳高,扔鏈球,坐下。通常,用機器人運轉(zhuǎn)來解決有關(guān)工作區(qū)的問題,而不能解決機器人本身運動所帶來的問題。對應(yīng)的工作區(qū)似乎破壞了機器人性能和運動目的之間的關(guān)系。這里我們已經(jīng)分析過了這些現(xiàn)象并用不同的觀點解決了運動特性的所帶來的問題。
在我們的觀點中,我們要求取消工作區(qū)的限制條件,同時,一個簡單的運動學(xué)信息可以對驅(qū)動自由度的機器人提供一個獨一無二的指南。不過,非驅(qū)動自由度的關(guān)節(jié)直接依賴于驅(qū)動自由度關(guān)節(jié)所產(chǎn)生的加速度。
從驅(qū)動關(guān)節(jié)的最終形態(tài)的前提出發(fā),產(chǎn)生的加速度能夠使每個關(guān)節(jié)都能夠運動至最終的目的地。在加速度水平的前提下,我們定義的控制策略只能夠使單個關(guān)節(jié)達到它的理想值。然而,就我們所知道的機器人關(guān)節(jié)加速度的分布圖是不能夠完全解決非驅(qū)動加速度的運動特性。我們選用當(dāng)?shù)貐?shù)DSs ,通過調(diào)節(jié)參數(shù)來改變加速度的大小。這種策略和其他策略一樣都是依賴于當(dāng)?shù)氐募铀俣取N覀儼堰@一效應(yīng)稱之為加速度的控制策略。
在整體控制策略的規(guī)劃下,非驅(qū)動關(guān)節(jié)的理論值和采用當(dāng)?shù)夭呗运玫降慕Y(jié)果幾乎是一致的。
該策略擁有這些測量特性,它讓迭代梯度值最小化。其中關(guān)鍵的是要讓該策略與參數(shù)值有直接關(guān)系。如果在每次迭代時,目標函數(shù)是已知的,則只需改變參數(shù)的大小就能改善關(guān)節(jié)的性能??蛇@種關(guān)系又是不明確的,因此,我們便用一個隨機變量來逼近梯度值,這是基于系統(tǒng)性能的迭代方法,對此我們有證據(jù)顯示這是機械的推斷學(xué)習(xí),在該情況下學(xué)習(xí)綜合的運動特性。