L(帮助)

L(软件著作权)
L(《大市唱》作者赵磊,保留软件著作权)

L(大市唱简介)
L(大市唱是一款虚拟歌手软件。用鼠标键盘触摸屏,编辑歌曲;软件自动把编辑内容转化成歌曲。)
L(大市唱拥有全套的歌曲制作工具,其中包括半自动谱曲功能、半自动生成beat和背景音乐的功能,以及混音功能。)
L(大市唱编辑控件人性化,坚持科技以人为本,向客户屏蔽专业术语。)
L(大市唱支持对歌声的细微调节,让歌曲达到发行唱片的品质。)
L(大市唱可以灵活的配置角色嗓音的音色,不必针对不同人的嗓音音色,进行AI炼丹。)
L(大市唱合成歌曲,也不需要AI炼丹,而是模拟人类发音的物理模型。)
L(模型大体上分为:1 没有滤波的声带音,2 口腔鼻腔等共振腔体。)

L(术语)
L(单位由大到小是:歌曲 自然段 句子 节拍(词) 音节 音符。)
L(音节可以有一个或者多个音符(滑音、连音)(乐理角度),音节由音标组成(语言学角度)。)

L(快捷键)
L(Space:播放或者转化)
L(Esc:停止播放、停止转化)
L(Enter:展开或者合起当前行)
L(Z:撤销)
L(Y:重复)

L(联系方式)
L(官方QQ群12:674931892 欢迎加入,一起讨论)

L(投诉渠道)
L(大市唱内核由赵磊单独开发完成。但是其他部分有很多第三方模块。)
L(以下是第三方模块的枚举,如果列表有丢失,请直接和我联系。)
L(联系方式:qq 1713134187 。)

L(模块)
L(midi文件格式处理,来自于) craigsapp-midifile http://midifile.sapp.org
L(midi转wave) TiMidity GPL2 https://sourceforge.net/projects/timidity/files/TiMidity%2B%2B/TiMidity%2B%2B-2.15.0/TiMidity++-2.15.0.tar.xz
L(我认为声乐曲和器乐曲,是完全独立的合成模块,也不存在互相调用的关系,我仅仅需要开源器乐曲的部分。) https://github.com/zhaoleicpp/midi/tree/main
L(x-sampa 与 ipa互相转化的模块来自于)node-x-sampa-ipa MIT https://github.com/andrefs/node-x-sampa-ipa
L(国际音标来自于汉语拼音的模块来自于)npm-pinyin2ipa MIT https://github.com/Connum/npm-pinyin2ipa
L(汉字转化成拼音模块来自于) pinyin4js License MIT
L(句子切分成词模块来自于) segmentit License MIT
L(汉语拼音转汉字模块来自于(只用了词典 )) kuaizi-ime-master License Apache-2.0 https://github.com/crazydan-studio/kuaizi-ime
L(Beat吉他来自于) Emperador 12 String Gtr, Emperador Of Sound, https://www.polyphone-soundfonts.com/documents/20077-emperador/documents
L(Beat钢琴来自于) Yamaha CFX Studio Grand V2, JT, https://www.polyphone-soundfonts.com/documents/15322-alphalux/documents
L(Beat鼓来自于) Industrial set, E-mu Sound Central, https://www.polyphone-soundfonts.com/documents/24-sound-effects/373-industrial-set
L(二维码生成器) License MIT, https://github.com/davidshimjs/qrcodejs
L(RAR解码) Free, https://www.rarlab.com/

L(特殊字符)
L(国际音标也比较粗,《大市唱》进行了细化,并引进新的字符进行表示。随着大市唱的升级,可能会进一步的细化。)
L(ƀ 浊辅音[b]。)
L(đ 浊辅音[d]。)
L(ǥ 浊辅音[g]。)
L(ѣ 𝓭 𝓰 分别是浊辅音[b][d][g]前面的声带音)
L(p̚ t̚ k̚ 粤语广东话的入声促音韵尾)

L(𝔪 [m]的闭音节,受前面元音的影响)

L(ɫ 英语angle中l的发音)

L(ռ 发an等鼻音n闭音节时,嘴唇还没有闭上时,音标[n]的发音)
L(ᵰ 发an等鼻音n闭音节时,嘴唇闭上后,音标[n]的发音)

L(𝓃 𝖓发nu等鼻音n开音节、音节的元音是突唇元音时,被元音影响的[n]的发音,𝓃距离元音远,𝖓距离元音近)

L(𝓅 𝑝 是被后面的元音影响的[pʰ],𝓅距离元音远,𝑝距离元音近。)
L(𝖕 被[pʰ]影响的后面的元音。)
L(𝓉 𝑡 是被后面的元音影响的[tʰ],𝓉距离元音远,𝑡距离元音近。)
L(𝖙 被[tʰ]影响的后面的元音。)
L(𝓀 𝑘 是被后面的元音影响的[kʰ],𝓀距离元音远,𝑘距离元音近。)
L(𝛋 被[kʰ]影响的后面的元音。)
L(𝒽 𝘩 是被后面的元音影响的[h],𝒽距离元音远,𝘩距离元音近。)
L(𝒉 被[h]影响的后面的元音。)
L(𝓍 𝘹 是被后面的元音影响的[x],𝓍距离元音远,𝘹距离元音近。)
L(𝖝 被[x]影响的后面的元音。)

L(𝑏 是被后面的元音影响的[p]。不送气的清擦音短,只用一个字符表示就行。)
L(𝖇 𝕓 𝒃 被[p]影响的后面的元音。𝖇距离元音最远,𝕓居中,𝒃最近。)
L(𝒹 是被后面的元音影响的[t]。不送气的清擦音短,只用一个字符表示就行。)
L(𝙙 𝕕 𝒅 被[t]影响的后面的元音。𝙙距离元音最远,𝕕居中,𝒅最近。)
L(𝑔 是被后面的元音影响的[k]。不送气的清擦音短,只用一个字符表示就行。)
L(𝖌 𝕘 𝒈 被[k]影响的后面的元音。𝖌距离元音最远,𝕘居中,𝒈最近。)
L(𝑓 是被后面的元音影响的[f]。)
L(ꬵ 𝕗 𝙛 被[f]影响的后面的元音。ꬵ距离元音最远,𝕗居中,𝙛最近。)
L(𝓿 是被后面的元音影响的[v]。)

L(ᵭ是[ð]的后半段)
L(𝓏是[z]的后半段)
L(Ȝ是[ʒ]的后半段)
L(ɀ是[ʐ]的后半段)
L(ر是[ɹ]的后半段)

L(𝓉s 𝑡s 被后面元音影响的[ʦʰ]。𝑡s 距离元音近。𝖙s 是[ʦʰ]的开始的声带音(暂不支持)。)
L(𝓉ʃ 𝑡ʃ 被后面元音影响的[ʧʰ]。𝑡ʃ 距离元音近,𝖙ʃ 是[ʧʰ]的开始的声带音。)
L(𝓉ʂ 𝑡ʂ 被后面元音影响的[tʂʰ]。𝑡ʂ 距离元音近。𝖙ʂ 是[tʂʰ]的开始的声带音(暂不支持)。)
L(𝓉ɕ 𝑡ɕ 是[ʨʰ]的两个辅音,𝓉ɕ先发生。𝖙ɕ被[ʨʰ]影响的元音)
L(𝒹z [ʦ][ʣ]的清擦音。𝒅z 是[ʦ][ʣ]的开始的声带音。)
L(𝒹ʒ [ʧ][ʤ]的清擦音。𝒅ʒ 是[ʧ][ʤ]的开始的声带音。)
L(𝒹ʐ [tʂ][dʐ]的清擦音。𝒅ʐ 是[tʂ][dʐ]的开始的声带音。)
L(𝒹ʑ [ʨ][ʥ]的清擦音。𝒅ʑ 是[ʨ][ʥ]的开始的声带音。)
L(英语国际音标的[tɹ]、[dɹ]实质是[tɹ̥ʷʰ]、[tɹ̥ʷ]或[dɹʷ])
L(𝓉ɹ̥ʷ 𝑡ɹ̥ʷ 是[tɹ̥ʷʰ]的两个清擦音,𝓉ɹ̥ʷ在前;𝖙ɹ̥ʷ是被[tɹ̥ʷʰ]影响的声带音)
L(𝒹ɹʷ是[tɹ̥ʷ][dɹʷ]的清擦音,𝒅ɹʷ是声带音)

L(𓍱是介于ɤ和o之间的音,用于汉语拼音o的结尾,也就是国际音标的⟨ɤʷ̜⟩ 注意右下角有个c,此音的圆唇程度低于国际音标的预设值。)

L(𓊖 代表清擦音静音,𓇷代表声带音静音,𓇳代表气音静音)

L(还没有完成的功能)
L(粤语暂时不支持“入声”)
L(打节拍设置 复制 粘贴功能)
L(音色设置 复制 粘贴功能 )
L(音色设置 插入行的功能)
L(打节拍设置的打节拍试听功能。)
L(嗓音音色设置的嗓音音色试听功能。)

L(已知错误)
L(目前 ufdata 导入,只有 日语罗马字+x-sampa发音(无方括号) 汉语拼音+x-sampa发音(无方括号) 两种方式。)
L(不超前鼻化。汉语拼音an这个音,在读a的时候,已经鼻化。尤其是在比较放松的状态,超前鼻化和连读都会比较重。个人听着,是在传递一种轻蔑的信息。)
L(鼻音等响辅音音量不减少。真实的人声是减少的,为了让歌曲更容易的把信息输入到人脑,这里不减振幅。最典型的响辅音[w]和[j],他们和[u][i],真人发音时基本上只有音量的区别,本软件无音量区别。)
L(身高很高,声带频率也很高时咬字不清。声带基频高,在频谱图上,声带音的相邻N倍频之间的距离就很大。如果元音共振峰正好在两个N倍频之间。这个共振峰就体现不出来。影响肉耳对元音内容的识别,也就是虚拟歌姬咬字不清。这个现象在京剧中,很容易出现。美声也有,美声唱法,高音只有“啊”等容易辨认的发音。我认为,要让歌姬发高音,就必须调整身高。配置歌姬身高较矮。)

L(音色相关的法律问题)
L(首先必须在作品中注明音色来源。关于音色的法律问题,不宜把法律解释的过于严格,影响经济发展。我个人认为,这个属于有争议的问题。最坏最坏最坏的情况,也只是构成侵权,而不是恶意侵权。我赚了多少钱,赔他多少钱。一倍赔偿,只是不赚钱而已。我在作品中注明来源,不用他公证出钱,把诉讼成本降到最低。虚拟歌手中,因为音色获得的利润比例并不大。)

L(滤波)
L(如果是模仿音色的话,)
L(先让大市唱和被模仿的音频,咬字等信息完全相同。)
L(比方说被模仿的音频说的是“啊” 这个字,我也让大市唱说“啊”,不让大市唱说“鹅”。)
L(然后导出大市唱的音频。)
L(两个音频除了音色信息以外,咬字长度音量等完全相同。)
L(然后在其他音频软件里对比频谱图。)
L(这样就能获得滤波信息了。)

L(工程文件格式转化)
L(支持 UFDATA 格式的导入导出。UFDATA 和其他虚拟歌姬工程文件的转化在:)
L(https://sdercolin.github.io/utaformatix3/)
L(对于汉语,歌词请用汉语拼音。)
L(对于日语,歌词请用罗板子单独音。)
L(大市唱将根据发音方法和拼写习惯,区分语言)

L(大市唱简化工程文件)
L(对于歌词和发音,不同语言做出下处理:)
L(汉语:只导出汉字,导入时根据词典确定读音。)
L(粤语:和汉语完全一致。)
L(英语:导出单词的音节写法,比如dog导出dog,happy导出hap-py。导入时根据词典确定读音。)
L(日语:提倡导出日语汉字,比如歌词:“あの先生”导出: “あ の 先生0 先生1 先生2 先生3”。导入时,根据词典确定发音。)
L(也可以只导出假名:“あ の せ ん せ い”。)
L(大市唱内部音高用浮点数表示,工程文件里也是浮点数。简化工程为四舍五入的整型。)

L(桌面版目录配置)
L(默认情况下,临时数据文件夹(TemporaryFiles)和 exe 在同一目录。)
L(也可以把临时数据文件夹放到其他地方,但是要在exe的文件夹里,建立一个指向目录的快捷方式,并且快捷方式的文件名必须是TemporaryFiles.lnk(.lnk一般不显示))
L(www文件夹里,放有网页文件,也可以用上述方法改变路径)

L(桌面版服务器配置)
L(架设好的服务器,只能在本机访问。)
L(服务器的http端口号是:48751)
L(服务器的WebSocket端口号是:48750)
L(暂时不能修改。)
L(需要用户自己编写asp才能让其他计算机访问。)
L(如果要架设穿透内网的服务器,还要建立一个指向asp网页的快捷方式,形如)
L(http://domain/api.aspx)
L(快捷方式命名为API.aspx.url(.url一般不显示))
L(API.aspx,和 exe 文件在同一目录,直接上传aps空间服务器就行。)
L(上传 API_intranet_traverse.aspx (这是内网穿透版本)到ASP 空间,重命名为 API.aspx。快捷方式命名为API.aspx.url指向ASP空间。不管本机是否有公网IP。)
L(API_local_transmit.aspx 仅局限于本机使用(暂时没写完),上传到本机ASP服务器目录,重命名为 API.aspx。快捷方式API.aspx.url 干掉。适合本机有公网IP的情况。)

L(API接口)
L(输入工程文件,输出wav。在转换过程中,输出转换进度)

L(提倡配置音色参数,不提倡提取声带振动)
L(建议手工配置音色信息。)
L(因为肉发音,尤其是歌唱艺术家,他们的声带振动方式,会在一个音节内不断地变化(尤其是经过长期训练的),持续不变的时间太短,无法提取。)
L(必须是音色的各个参数,持续不变,1秒钟以上,才能提取声带的振动(频谱精细度和时间长度有关,和采样频率无关)。)
L(实际还原的时候,也是提取多个声带振动,一个音节内的不同的时间,切换到不同的声带振动。)
L(一个音节内,声带振动方式有变化的情况,很难一步到位提取。)

L(工程文件深度学习AI)
L(用工程文件,作为学习资料;深度学习AI,实现自动谱曲。)
L(这个想法,我已经写在这里了,不要去注册专利了。)

L(人声滤波器数据)
L(背景音乐和人声混音,防止背景音乐掩盖人声,所以要对背景音乐滤波。)
L(可以下载人声滤波器数据,对于一个像素坐标,x代表时间,y代表频率。白色代表保留背景音乐,黑色代表干掉背景音乐。)
L(像素x坐标单位是:步长(64个音频采样点),步长(64个采样点)/音频采样频率(16000Hz),4毫秒。)
L(像素y坐标单位是:(音频采样频率(16000Hz)/2)/ 图像高度(512),15.625Hz。)
L(像素y坐标从最下面开始算起(y = 512-1 = 511),第一个点就是 15.625Hz,没有直流分量。最上面的点是8000Hz。)

L(自定义Beat乐器)
L(直接对乐器录音就行,大市唱beat编辑器有很多工具,提升音色。)
L(如果用第三方的录音,一定确定得到相应的授权。)
L(推荐使用midi音色文件(同样需要授权),并用 polyphone.exe )L((免费) 攫取。最后导入《大市唱》。)

L(警告:不得使用大市唱注音的方法!)
L(《大市唱》的注音方法是国际音标的扩展,扩展方式并非有限种;)
L(因为客户操作的需要,必须暴露给公众。)
L(《大市唱》的注音方法是赵磊独自享有的知识产权。其他人不能抄袭一部分或者全部,)
L(或者以此为基础,做少量修改,规避法律责任。)
L(否则赵磊将和他诉讼到底。)

L(警告:在没有得到大市唱授权的前提下,不得使用《大市唱》合成结果作为AI学习的资料!)
L(《大市唱》的合成结果,包含赵磊辛苦数年提取的共振峰曲线、时域包络等发音参数。)
L(客户不能把《大市唱》的合成结果,输入给(深度)学习AI。)
L(否则赵磊将和他诉讼到底。)

L(警告:不得使用没有授权的音乐的《大市唱》工程文件,作为AI谱曲的学习资料!)
L(Suno 算法的优势在于,把音频文件转化成token,大市唱的工程文件就是一种token。)
L(把音乐手动转化成大市唱工程文件格式,让机器学习,就可以实现机器AI自动谱曲。)
L(但是如果音乐本身没有授权,就涉嫌侵权了。)

L(警告:攫取音色必须注明是模拟的音色,不能以被攫取人的名义发行作品!)
L(《大市唱》的攫取音色的功能,孤立的片面的仅仅取声带的振动方式。)
L(清擦音、吐字、音调频率的细微变化方式,音量的细微变化方式等信息都不涉及。)
L(单纯的取音色也就是声带振动的信息,《大市唱》认为不涉及人格权、声音权、著作权。)
L(如果加上被攫取人的名义,我认为立即构成侵权,但是大市唱免责。)
L(其他虚拟歌手,只要学习材料的时长超过1秒钟,)
L(不管是不是叫做音色攫取,我认为都是声音攫取,肯定构成人格权侵权。)

L(警告:不得使用大市唱谱曲的方法!)
L(《大市唱》谱曲的方法,是赵磊用了大量的时间,分析大量的流行歌曲总结出来的谱曲方法。)
L(《大市唱》谱曲的方法,是谱曲软件的需求分析,虽然需求分析不受法律保护;)
L(但是,出现在《大市唱》的谱曲界面的,文字记载的谱曲方法,也是关于谱曲的文字著作。)
L(赵磊是唯一作者,享有全部的著作权。)