L(返回)

L(帮助)

L(软件著作权)

L(《大市唱》作者赵磊，保留软件著作权)

L(大市唱简介)

L(大市唱是一款虚拟歌手软件。用鼠标键盘触摸屏，编辑歌曲；软件自动把编辑内容转化成歌曲。)

L(大市唱拥有全套的歌曲制作工具，其中包括半自动谱曲功能、半自动生成beat和背景音乐的功能，以及混音功能。)

L(大市唱编辑控件人性化，坚持科技以人为本，向客户屏蔽专业术语。)

L(大市唱支持对歌声的细微调节，让歌曲达到发行唱片的品质。)

L(大市唱可以灵活的配置角色嗓音的音色，不必针对不同人的嗓音音色，进行AI炼丹。)

L(大市唱合成歌曲，也不需要AI炼丹，而是模拟人类发音的物理模型。)

L(模型大体上分为：1 没有滤波的声带音，2 口腔鼻腔等共振腔体。)

L(术语)

L(单位由大到小是：歌曲自然段句子节拍(词) 音节音符。)

L(音节可以有一个或者多个音符（滑音、连音）（乐理角度），音节由音标组成（语言学角度）。)

L(快捷键)

L(Space：播放或者转化)

L(Esc：停止播放、停止转化)

L(Enter：展开或者合起当前行)

L(Z：撤销)

L(Y：重复)

L(联系方式)

L(官方QQ群12：674931892 欢迎加入，一起讨论)

L(投诉渠道)

L(大市唱内核由赵磊单独开发完成。但是其他部分有很多第三方模块。)

L(以下是第三方模块的枚举，如果列表有丢失，请直接和我联系。)

L(联系方式：qq 1713134187 。)

L(模块)

L(midi文件格式处理，来自于) craigsapp-midifile http://midifile.sapp.org

L(midi转wave) TiMidity GPL2 https://sourceforge.net/projects/timidity/files/TiMidity%2B%2B/TiMidity%2B%2B-2.15.0/TiMidity++-2.15.0.tar.xz

L(我认为声乐曲和器乐曲，是完全独立的合成模块，也不存在互相调用的关系，我仅仅需要开源器乐曲的部分。) https://github.com/zhaoleicpp/midi/tree/main

L(x-sampa 与 ipa互相转化的模块来自于)node-x-sampa-ipa MIT https://github.com/andrefs/node-x-sampa-ipa

L(国际音标来自于汉语拼音的模块来自于)npm-pinyin2ipa MIT https://github.com/Connum/npm-pinyin2ipa

L(汉字转化成拼音模块来自于) pinyin4js License MIT

L(句子切分成词模块来自于) segmentit License MIT

L(汉语拼音转汉字模块来自于（只用了词典）) kuaizi-ime-master License Apache-2.0 https://github.com/crazydan-studio/kuaizi-ime

L(Beat吉他来自于) Emperador 12 String Gtr, Emperador Of Sound, https://www.polyphone-soundfonts.com/documents/20077-emperador/documents

L(Beat钢琴来自于) Yamaha CFX Studio Grand V2, JT, https://www.polyphone-soundfonts.com/documents/15322-alphalux/documents

L(Beat鼓来自于) Industrial set, E-mu Sound Central, https://www.polyphone-soundfonts.com/documents/24-sound-effects/373-industrial-set

L(二维码生成器) License MIT, https://github.com/davidshimjs/qrcodejs

L(RAR解码) Free, https://www.rarlab.com/

L(特殊字符)

L(国际音标也比较粗，《大市唱》进行了细化，并引进新的字符进行表示。随着大市唱的升级，可能会进一步的细化。)

L(ƀ 浊辅音[b]。)

L(đ 浊辅音[d]。)

L(ǥ 浊辅音[g]。)

L(ѣ 𝓭 𝓰 分别是浊辅音[b][d][g]前面的声带音)

L(p̚ t̚ k̚ 粤语广东话的入声促音韵尾)

L(𝔪 [m]的闭音节，受前面元音的影响)

L(ɫ 英语angle中l的发音)

L(ռ 发an等鼻音n闭音节时，嘴唇还没有闭上时，音标[n]的发音)

L(ᵰ 发an等鼻音n闭音节时，嘴唇闭上后，音标[n]的发音)

L(𝓃 𝖓发nu等鼻音n开音节、音节的元音是突唇元音时，被元音影响的[n]的发音，𝓃距离元音远，𝖓距离元音近)

L(𝓅 𝑝 是被后面的元音影响的[pʰ]，𝓅距离元音远，𝑝距离元音近。)

L(𝖕 被[pʰ]影响的后面的元音。)

L(𝓉 𝑡 是被后面的元音影响的[tʰ]，𝓉距离元音远，𝑡距离元音近。)

L(𝖙 被[tʰ]影响的后面的元音。)

L(𝓀 𝑘 是被后面的元音影响的[kʰ]，𝓀距离元音远，𝑘距离元音近。)

L(𝛋 被[kʰ]影响的后面的元音。)

L(𝒽 𝘩 是被后面的元音影响的[h]，𝒽距离元音远，𝘩距离元音近。)

L(𝒉 被[h]影响的后面的元音。)

L(𝓍 𝘹 是被后面的元音影响的[x]，𝓍距离元音远，𝘹距离元音近。)

L(𝖝 被[x]影响的后面的元音。)

L(𝑏 是被后面的元音影响的[p]。不送气的清擦音短，只用一个字符表示就行。)

L(𝖇 𝕓 𝒃 被[p]影响的后面的元音。𝖇距离元音最远，𝕓居中，𝒃最近。)

L(𝒹 是被后面的元音影响的[t]。不送气的清擦音短，只用一个字符表示就行。)

L(𝙙 𝕕 𝒅 被[t]影响的后面的元音。𝙙距离元音最远，𝕕居中，𝒅最近。)

L(𝑔 是被后面的元音影响的[k]。不送气的清擦音短，只用一个字符表示就行。)

L(𝖌 𝕘 𝒈 被[k]影响的后面的元音。𝖌距离元音最远，𝕘居中，𝒈最近。)

L(𝑓 是被后面的元音影响的[f]。)

L(ꬵ 𝕗 𝙛 被[f]影响的后面的元音。ꬵ距离元音最远，𝕗居中，𝙛最近。)

L(𝓿 是被后面的元音影响的[v]。)

L(ᵭ是[ð]的后半段)

L(𝓏是[z]的后半段)

L(Ȝ是[ʒ]的后半段)

L(ɀ是[ʐ]的后半段)

L(ر是[ɹ]的后半段)

L(𝓉s 𝑡s 被后面元音影响的[ʦʰ]。𝑡s 距离元音近。𝖙s 是[ʦʰ]的开始的声带音（暂不支持）。)

L(𝓉ʃ 𝑡ʃ 被后面元音影响的[ʧʰ]。𝑡ʃ 距离元音近，𝖙ʃ 是[ʧʰ]的开始的声带音。)

L(𝓉ʂ 𝑡ʂ 被后面元音影响的[tʂʰ]。𝑡ʂ 距离元音近。𝖙ʂ 是[tʂʰ]的开始的声带音（暂不支持）。)

L(𝓉ɕ 𝑡ɕ 是[ʨʰ]的两个辅音，𝓉ɕ先发生。𝖙ɕ被[ʨʰ]影响的元音)

L(𝒹z [ʦ][ʣ]的清擦音。𝒅z 是[ʦ][ʣ]的开始的声带音。)

L(𝒹ʒ [ʧ][ʤ]的清擦音。𝒅ʒ 是[ʧ][ʤ]的开始的声带音。)

L(𝒹ʐ [tʂ][dʐ]的清擦音。𝒅ʐ 是[tʂ][dʐ]的开始的声带音。)

L(𝒹ʑ [ʨ][ʥ]的清擦音。𝒅ʑ 是[ʨ][ʥ]的开始的声带音。)

L(英语国际音标的[tɹ]、[dɹ]实质是[tɹ̥ʷʰ]、[tɹ̥ʷ]或[dɹʷ])

L(𝓉ɹ̥ʷ 𝑡ɹ̥ʷ 是[tɹ̥ʷʰ]的两个清擦音，𝓉ɹ̥ʷ在前；𝖙ɹ̥ʷ是被[tɹ̥ʷʰ]影响的声带音)

L(𝒹ɹʷ是[tɹ̥ʷ][dɹʷ]的清擦音，𝒅ɹʷ是声带音)

L(𓍱是介于ɤ和o之间的音，用于汉语拼音o的结尾，也就是国际音标的⟨ɤʷ̜⟩ 注意右下角有个c，此音的圆唇程度低于国际音标的预设值。)

L(𓊖 代表清擦音静音，𓇷代表声带音静音，𓇳代表气音静音)

L(还没有完成的功能)

L(粤语暂时不支持“入声”)

L(打节拍设置复制粘贴功能)

L(音色设置复制粘贴功能 )

L(音色设置插入行的功能)

L(打节拍设置的打节拍试听功能。)

L(嗓音音色设置的嗓音音色试听功能。)

L(已知错误)

L(目前 ufdata 导入，只有日语罗马字+x-sampa发音（无方括号）汉语拼音+x-sampa发音（无方括号）两种方式。)

L(不超前鼻化。汉语拼音an这个音，在读a的时候，已经鼻化。尤其是在比较放松的状态，超前鼻化和连读都会比较重。个人听着，是在传递一种轻蔑的信息。)

L(鼻音等响辅音音量不减少。真实的人声是减少的，为了让歌曲更容易的把信息输入到人脑，这里不减振幅。最典型的响辅音[w]和[j]，他们和[u][i]，真人发音时基本上只有音量的区别，本软件无音量区别。)

L(身高很高，声带频率也很高时咬字不清。声带基频高，在频谱图上，声带音的相邻N倍频之间的距离就很大。如果元音共振峰正好在两个N倍频之间。这个共振峰就体现不出来。影响肉耳对元音内容的识别，也就是虚拟歌姬咬字不清。这个现象在京剧中，很容易出现。美声也有，美声唱法，高音只有“啊”等容易辨认的发音。我认为，要让歌姬发高音，就必须调整身高。配置歌姬身高较矮。)

L(音色相关的法律问题)

L(首先必须在作品中注明音色来源。关于音色的法律问题，不宜把法律解释的过于严格，影响经济发展。我个人认为，这个属于有争议的问题。最坏最坏最坏的情况，也只是构成侵权，而不是恶意侵权。我赚了多少钱，赔他多少钱。一倍赔偿，只是不赚钱而已。我在作品中注明来源，不用他公证出钱，把诉讼成本降到最低。虚拟歌手中，因为音色获得的利润比例并不大。)

L(滤波)

L(如果是模仿音色的话，)

L(先让大市唱和被模仿的音频，咬字等信息完全相同。)

L(比方说被模仿的音频说的是“啊” 这个字，我也让大市唱说“啊”，不让大市唱说“鹅”。)

L(然后导出大市唱的音频。)

L(两个音频除了音色信息以外，咬字长度音量等完全相同。)

L(然后在其他音频软件里对比频谱图。)

L(这样就能获得滤波信息了。)

L(工程文件格式转化)

L(支持 UFDATA 格式的导入导出。UFDATA 和其他虚拟歌姬工程文件的转化在：)

L(https://sdercolin.github.io/utaformatix3/)

L(对于汉语，歌词请用汉语拼音。)

L(对于日语，歌词请用罗板子单独音。)

L(大市唱将根据发音方法和拼写习惯，区分语言)

L(大市唱简化工程文件)

L(对于歌词和发音，不同语言做出下处理：)

L(汉语：只导出汉字，导入时根据词典确定读音。)

L(粤语：和汉语完全一致。)

L(英语：导出单词的音节写法，比如dog导出dog，happy导出hap-py。导入时根据词典确定读音。)

L(日语：提倡导出日语汉字，比如歌词：“あの先生”导出: “あの先生0 先生1 先生2 先生3”。导入时，根据词典确定发音。)

L(也可以只导出假名：“あのせんせい”。)

L(大市唱内部音高用浮点数表示，工程文件里也是浮点数。简化工程为四舍五入的整型。)

L(桌面版目录配置)

L(默认情况下，临时数据文件夹（TemporaryFiles）和 exe 在同一目录。)

L(也可以把临时数据文件夹放到其他地方，但是要在exe的文件夹里，建立一个指向目录的快捷方式，并且快捷方式的文件名必须是TemporaryFiles.lnk（.lnk一般不显示）)

L(www文件夹里，放有网页文件，也可以用上述方法改变路径)

L(桌面版服务器配置)

L(架设好的服务器，只能在本机访问。)

L(服务器的http端口号是：48751)

L(服务器的WebSocket端口号是：48750)

L(暂时不能修改。)

L(需要用户自己编写asp才能让其他计算机访问。)

L(如果要架设穿透内网的服务器，还要建立一个指向asp网页的快捷方式，形如)

L(http://domain/api.aspx)

L(快捷方式命名为API.aspx.url（.url一般不显示）)

L(API.aspx，和 exe 文件在同一目录，直接上传aps空间服务器就行。)

L(上传 API_intranet_traverse.aspx （这是内网穿透版本）到ASP 空间，重命名为 API.aspx。快捷方式命名为API.aspx.url指向ASP空间。不管本机是否有公网IP。)

L(API_local_transmit.aspx 仅局限于本机使用（暂时没写完），上传到本机ASP服务器目录，重命名为 API.aspx。快捷方式API.aspx.url 干掉。适合本机有公网IP的情况。)

L(API接口)

L(输入工程文件，输出wav。在转换过程中，输出转换进度)

L(提倡配置音色参数，不提倡提取声带振动)

L(建议手工配置音色信息。)

L(因为肉发音，尤其是歌唱艺术家，他们的声带振动方式，会在一个音节内不断地变化（尤其是经过长期训练的），持续不变的时间太短，无法提取。)

L(必须是音色的各个参数，持续不变，1秒钟以上，才能提取声带的振动（频谱精细度和时间长度有关，和采样频率无关）。)

L(实际还原的时候，也是提取多个声带振动，一个音节内的不同的时间，切换到不同的声带振动。)

L(一个音节内，声带振动方式有变化的情况，很难一步到位提取。)

L(工程文件深度学习AI)

L(用工程文件，作为学习资料；深度学习AI，实现自动谱曲。)

L(这个想法，我已经写在这里了，不要去注册专利了。)

L(人声滤波器数据)

L(背景音乐和人声混音，防止背景音乐掩盖人声，所以要对背景音乐滤波。)

L(可以下载人声滤波器数据，对于一个像素坐标，x代表时间，y代表频率。白色代表保留背景音乐，黑色代表干掉背景音乐。)

L(像素x坐标单位是：步长（64个音频采样点），步长（64个采样点）/音频采样频率（16000Hz），4毫秒。)

L(像素y坐标单位是：（音频采样频率（16000Hz）/2）/ 图像高度（512），15.625Hz。)

L(像素y坐标从最下面开始算起（y = 512-1 = 511），第一个点就是 15.625Hz，没有直流分量。最上面的点是8000Hz。)

L(自定义Beat乐器)

L(直接对乐器录音就行，大市唱beat编辑器有很多工具，提升音色。)

L(如果用第三方的录音，一定确定得到相应的授权。)

L(推荐使用midi音色文件（同样需要授权），并用 polyphone.exe )

L(（免费）攫取。最后导入《大市唱》。)

L(警告：不得使用大市唱注音的方法！)

L(《大市唱》的注音方法是国际音标的扩展，扩展方式并非有限种；)

L(因为客户操作的需要，必须暴露给公众。)

L(《大市唱》的注音方法是赵磊独自享有的知识产权。其他人不能抄袭一部分或者全部，)

L(或者以此为基础，做少量修改，规避法律责任。)

L(否则赵磊将和他诉讼到底。)

L(警告：在没有得到大市唱授权的前提下，不得使用《大市唱》合成结果作为AI学习的资料！)

L(《大市唱》的合成结果，包含赵磊辛苦数年提取的共振峰曲线、时域包络等发音参数。)

L(客户不能把《大市唱》的合成结果，输入给（深度）学习AI。)

L(否则赵磊将和他诉讼到底。)

L(警告：不得使用没有授权的音乐的《大市唱》工程文件，作为AI谱曲的学习资料！)

L(Suno 算法的优势在于，把音频文件转化成token，大市唱的工程文件就是一种token。)

L(把音乐手动转化成大市唱工程文件格式，让机器学习，就可以实现机器AI自动谱曲。)

L(但是如果音乐本身没有授权，就涉嫌侵权了。)

L(警告：攫取音色必须注明是模拟的音色，不能以被攫取人的名义发行作品！)

L(《大市唱》的攫取音色的功能，孤立的片面的仅仅取声带的振动方式。)

L(清擦音、吐字、音调频率的细微变化方式，音量的细微变化方式等信息都不涉及。)

L(单纯的取音色也就是声带振动的信息，《大市唱》认为不涉及人格权、声音权、著作权。)

L(如果加上被攫取人的名义，我认为立即构成侵权，但是大市唱免责。)

L(其他虚拟歌手，只要学习材料的时长超过1秒钟，)

L(不管是不是叫做音色攫取，我认为都是声音攫取，肯定构成人格权侵权。)

L(警告：不得使用大市唱谱曲的方法！)

L(《大市唱》谱曲的方法，是赵磊用了大量的时间，分析大量的流行歌曲总结出来的谱曲方法。)

L(《大市唱》谱曲的方法，是谱曲软件的需求分析，虽然需求分析不受法律保护；)

L(但是，出现在《大市唱》的谱曲界面的，文字记载的谱曲方法，也是关于谱曲的文字著作。)

L(赵磊是唯一作者，享有全部的著作权。)