praat中文说明Word文档下载推荐.docx
《praat中文说明Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《praat中文说明Word文档下载推荐.docx(44页珍藏版)》请在冰豆网上搜索。
當你不能利用New來錄音時,可選用你Windows中的“錄音機”功能來錄音
並保存爲WAV格式:
開始——程式——附件——娛樂——錄音機;
錄音機文件——屬性:
11K16位單聲道OK!
按紅色鈕開始錄音,按黑色鈕停止錄音;
文件——保存(指定路徑和檔案名)
(2)在Praat中保存語音文件:
左框主功能表中(Objects),選擇write中任意中格式,但通用格式爲WAV;
指定路徑和檔案名。
二.語音標注(Label&
segment-analysis)
(1)用左框主功能表中的read來調出信號文件;
(2)左框主功能表中右手邊功能表,選擇Edit,就會出現一個图形窗
(1),上部爲波形,下部爲语图,在此窗中的主功能表View,可加選pitch,formant,energy;
(3)图形窗(1)中的Edit,可以編輯選擇部分信號並存文件;
(4)左框主功能表中右手邊功能表,選擇Label&
segment-analyse,
(5)出現一個需要選擇的文字框,選擇toTextGrid,填入tiername,pointtier;
就會産生一個TextGrid的新文件,擊右手邊的Edit,就會出現一個文本框,然後與波形窗
對齊,在文本框内,用滑鼠選擇音節段,或聲母,韻母就可用音標符號標注。
(6)標注完成後,在此框中的主功能表file—writetextgridtotextfile,選擇你存入的地址和名字,就完成了。
此textfile可以在Praat環境中,using“edit”todisplayplotter出來,andopenthisfileonMicrosoftWordtodisplaydigitaltext.
三.音高(Pitch)分析(包括三維语图和共振峰歷程分析):
(1)調出已保存語音文件:
Read---Readfromfile(Soundxxx),使用edit去畫出三維语图(showspectrogram)和音高曲線(showpitch),記錄下要取消的部分(在後面的excel中)的起點和終點時間;
(2)第一種比較複雜然而比較多用途的方法如下:
修正基音標記:
先用praat標記周期(periodicity---topointprocess),此時出現一個PointProcess文件[1],使用Edit,出現一個基音周期調整框。
若需要的話,可人工檢查修正這些標記,方法是:
用滑鼠去框住不要(亂的)部分,在子功能表上選擇
Point---Removepoint;
完成以後用praat把周期文件轉化成音高文件(topitchtier)(,此時在object
列表框空白處出現一個PitchTier的文件。
這個文件可使用Edit命令畫出一個音高(Pitch)隨時間變化的图形,F0(t)。
也能用滑鼠去圈定一段不要的基頻,Point—remove就能取消這些點;
可滑動滑鼠去讀出每個样点上的音高數值;
然後返回到功能表(object)去保存一個文字檔案:
Write---toheadlessspreadsheet
file。
音高文件本身是一個文字檔案(F0資料),可以用Excel打開這個文件,首先按照
先前記錄下的待取消部分的時間,將其時間和數據”清除”,這樣就能使音節之間有效的音高
曲綫得到分離;
然後把基頻(F0)數據全部換算成半音或五度制。
最後用Excel作成图表;
辦法是:
[1]五度制转换:
激活C1(EXCEL表中第C列,第一行,這是假定在B列中存放了F0数据,計算結果將放在C列的第一行),調出函數log10,在下面空白處打入B1/f1,f1可設為當前F0的最低值;
按一下enter,將鼠標放到公式結尾處,打入*16.61,按一下鍵盤上的enter鍵,在C1格内就出現五度值;
*B1是存放音高數據的列的第一行數據
[2]copyC1,再激活全部C列,點paste,C列就全部置換成五度值了。
[3]激活C列,點“制图”,選“折线”,“下一步”,到“4步驟3”,點“數據表”,再選中
“顯示數據表”,點一下“完成”。
主表object中選擇Downtotableofreal,主表中出現一個同名的文件,然後,Draw,在副表中會顯示全部音高值(爲此,先在副表中用鼠標畫出一個窗,以便容納全部音高數據),使用copytoclipboard,將數據貼到word文當中去.
(3)另一種是分析音高的簡單方法:
在調出語音文件後,Praat使用Edit畫出既有語音波形,又有三維语图、音高曲
線、共振峰和音強等,這些語音聲學特性是否需要顯示在图上,可有自己選擇:
啟動Show,就可選中或關閉某項聲學特性。
爲了突出語音部分,可以先整理波形,剪切掉無用部分;
只显示語圖和音高曲線(showspectrogram;
showpitch);
選擇语图中音高曲線與母音重叠部分,用滑鼠測量曲線的起始點音高值、拐點(如
有必要的話)和終點;
將每個音節的音高值填入EXCEL,表,每個音節兩個或三個F0,從上而下排列,音節之間空一格;
(建議測量三點)
如需要的話,在EXCEL表上將F0轉換成半音或五度值;
然後就可以作图。
辦法如
下:
[1]五度制轉換:
激活C1(EXCEL表中第C列,第一行)(假定將計算結果放入C1),調出函數log10(插入—函數—三角函數—log10),在下面空白處打入B1/f1,f1可設為當前F0的最低值(或任意值);
*B1是存放音高數據的列的第一行
[2]copyC1,激活全部C列,點paste,C列就全部置換成五度值了。
[3]激活C列,點“製圖”,選“折線”,“下一步”,到“4步驟3”,點“數據表”,再選中
請你分析声调:
專麻古五對大第百白
四.语图分析和元音共振峰數據提取:
1.在主表(objective)中讀出(read)一個聲音文件(soundfile);
並聽語音回放play;
2.在主表中選擇formant,副表設置一View,主表選擇Draw—Speckle;
3.在主表中選擇”Downtoformanttier”;
nextto“DowntoTableofreal”.此時主表中顯示一”Tableofreal„„(filename)”,接著在副表中設一View;
4.在主表中選擇Draw---Drawasnumber---free,此時在View中列出全部有效的共振峰數據;
5.可以在Excel中打開Tableofreal作爲一個被儲存的PostScript文件;
6.副表中的共振峰數據即可以WritetoClipboad,也可以打印(Print)出數據;
7.讀出光標點四個共振峰數據:
在子表的三維語圖上選擇一個時刻(TargetPoint),然後選擇Formant—Formantreport,即可得到所要的共振峰讀數;
8.二維功率譜:
在子表的三維語圖上選擇一個時刻(TargetPoint),然後選擇spectrum---viewspectralslice.
请问,为什么要*16.61?
5/LOG
(2)=16.6096404744368
那是把每倍频程看成是5度的算法。
12/LOG
(2)=39.8631371386483
那是把每倍频程看成是12半音的算法。
建议使用半音的算法。
D=5lg(f/fr)/lg2
st=12lg(f/fr)/lg2
式中fr是参考频率。
那个D式,包括16.61的始作俑者是本人。
那是1970-1980年代的需要。
北大80周年校庆中文系学术论坛上我首次提出D式(1979)。
对于国际交流来说,还是用st(半音,semitone)更好。
在PSOLA中基音同步标记的求取是很重要的步骤,我想请问各位高手:
应该如何求取基音
同步标记。
能否提供一些可行的算法。
哪里能够下载可参考的程序。
谢谢!
QUOTE:
ThefollowingisasummaryIwroteinanotherplace.Justcopyithere,hopeit'
shelpful.Youarerightabouttheimportanceofpitchmarks.WhenIbuildaTTScorpus,Id
idthefollowing:
1)Preparetextsforrecording.Youhavetotranscribethetextintophoneticsymbol
s(suchaspinyin),consideringthephonemecoverageandbalance,theprosodicco
verage,
2)Recordsoundpressureandlaryngographsignalssimultaneouslyforthetexts.Th
elaryngographsignalisoptional,butithelpstodeterminetheGCI(glottalclosure
instant)ofthespeech.
3)Forcethespeechsignaltobealignedwithphonetictranscriptions.Alignmenterr
orshavetobecheckedandcorrected.Maybesomesentenceshavetobere-record
ed.
4)Generatepitchmarks.PitchmarksareusuallyassignedateachGCIdetectedfro
mthesignalbycertainalgrithm.Themarksmightneedtobemannuallycheckeda
ndcorrectedincasetheGCIdetectionalgrithmdoesn'
tworkwell.Theunvoiceseg
ementsinthespeechalsoneedfalse"
pitch"
marksin