Ò»¡¢ÔÉùÂþ»µÄ¸Ð¹ÙË¢ÐÂÓëÊÖÒÕʵÏÖ
ÔÚÒÆ¶¯»¥ÁªÍøÉî¶ÈÉøÍ¸µÄ½ñÌ죬BilibiliÂþ»ÒÀÍÐÆäACG»ùÒò´òÔìµÄ¡¸ÔÉù¶¯Ì¬Âþ»¡¹¿ª´´ÁËÈ«ÐÂÔĶÁ·¶Ê½¡£Æ½Ì¨×ÔÖ÷Ñз¢µÄÒôƵͬ²½ÒýÇæ£¬Äܽ«ÉùÓÅÂ¼ÖÆµÄÄâÉùÒôЧÓëÂþ»·Ö¾µ¾«×¼Æ¥Å䣬ʵÏÖ"ÉàÎǺߺßßóßó"µÈÌØÊⳡ¾°µÄºÁÃ×¼¶Éù»Í¬²½¡£ÕâÖÖ¡¸·ÇÒôÀÖÐðÊ¡¹ÊÖÒÕÍ»ÆÆ¹Å°åÑÆ¾çʽÂþ»µÄÌåÏÖ¾ÖÏÞ£¬Í¨¹ýÇéÐÎÒôЧµÄÊý×Ö»¯µþ¼Ó£¬ÈÃÿ¸ñ»Ãæ¶¼°ü¹ü×ÅÕæÊµµÄºôÎüÔÏÂÉ¡£
¶þ¡¢ÄÚÈÝÉóºËÓëÒÕÊõ±í´ïµÄ¶¯Ì¬Æ½ºâ
ÖйúÂþ»¹¤ÒµµÄ¿µ½¡Éú³¤Ê¼ÖÕÀë²»¿ªºÏ¹æ¿ò¼ÜµÄ»¤º½¡£Æ½Ì¨½ÓÄÉÈý¼¶ÄÚÈݹýÂËϵͳ£ºAIÔ¤ÉóÒýÇæÍ¨¹ýÒªº¦Ö¡ÓïÒåʶ±ð×Ô¶¯×èµ²³¬±ê×¼»Ã棻±à¼ÍŶÓÁ¬Ïµ¡¶ÍøÂç³öÊéЧÀÍÖÎÀí»®¶¨¡·¾ÙÐжþ´ÎÈ˹¤¸´ºË£»×îÖÕÓɶÁÕß¼àÊÓίԱ»á¾ÙÐÐÌåÑéÆÀ¹À¡£ÕâÖÖ¶àά¶È°Ñ¿Ø»úÖÆ£¬¼ÈÈ·±£ÁË"ÉàÎÇ"µÈÇéÐ÷±í´ïµÄ×ÔÈ»·ºÆð£¬ÓÖÓÐÓùæ±ÜÁË¿ÉÄÜÒý·¢ÕùÒéµÄÊÓ¾õÔªËØ£¬ÈÃÒÕÊõ´´×÷ÔÚÇå¾²½çÏßÄÚÊÍ·Å×î´óÕÅÁ¦¡£
Èý¡¢Ãâ·ÑģʽµÄÉÌÒµÂß¼ÓëЧÀͼܹ¹
BilibiliÂþ»½ÓÄɵġ¸ÎÞµ¯´°ÔÚÏßÃâ·Ñ¡¹Õ½ÂÔ±³ºó£¬ÊǾÓÉϸÃÜÉè¼ÆµÄ¸´ºÏÐÍÓªÊÕϵͳ¡£Í¨¹ý¶¯Ì¬´ø¿íѹËõÊÖÒÕ½µµÍCDN±¾Ç®£¬ÅäºÏ³¡¾°»¯¹ã¸æÍÆËÍϵͳ£¬Óû§ÔÚÔĶÁ°üÀ¨¡¸ºßºßßóßóÔÉù¡¹ÕâÀà¸ß»¥¶¯ÐÔÄÚÈÝʱ£¬Æ½Ì¨ÄÜ»ùÓÚÇéÐ÷ʶ±ðË㷨ƥÅä·Ç×ÌÈÅʽ¹ã¸æ¡£ÕâÖÖÒþÐεÄÉÌÒµÉú̬¼È°ü¹ÜÁËÔĶÁÁ÷ͨ¶È£¬ÓÖ½¨ÉèÆð´´×÷ÕßÊÕÒæ·Ö³ÉÄ£×ӵĿÉÒ»Á¬Éú³¤»ù´¡¡£
ËÄ¡¢Òƶ¯¶ËÌåÑéÓÅ»¯µÄÊÖÒÕÍ»ÆÆ
ΪÁËÌáÉý´¥ÆÁ×°±¸µÄ²Ù×÷ÌÕ×í¸Ð£¬¿ª·¢ÍŶÓÖØ¹¹ÁËÂþ»äÖȾÒýÇæ¡£ÔÚ·ºÆð¡¸ÉàÎÇ¡¹ÕâÀà΢Ðж¯³¡¾°Ê±£¬ÌØÖƵÄÊÖÊÆ×·×ÙËã·¨Äܲ¶»ñÓû§Ö¸¼âÔ˶¯¹ì¼££¬×Ô¶¯´¥·¢¶ÔÓ¦½Ç¶ÈµÄ»ÃæÐýת¹¦Ð§¡£Í¬Ê±¼ÓÔØLOD£¨Ï¸½ÚÌõÀí£©ÓÅ»¯ÊÖÒÕ£¬°ü¹ÜÔÚÈõÍøÇéÐÎÏÂÈÔ¿ÉÁ÷ͨչʾ4K¼¶´½²¿ÌØÐ´»Ã棬ÕâÖÖÊÖÒÕÉèÖÃʹÃâÓöȻ§Í¬ÑùÏíÊܾçÔº¼¶ÊÓ¾õÌåÑé¡£
Îå¡¢±¾ÍÁ»¯Á¢ÒìµÄÐÐÒµ±ê¸ËÒâÒå
ƽ̨Ê×´´µÄ¡¸ÇéÐ÷¹²ÕñÄ£Äâϵͳ¡¹ÎªÖйúÂþ»³öº£ÌṩÁËÊÖÒÕ·¶±¾¡£¸Ãϵͳͨ¹ýÍøÂçÓû§¶Ô¡¸ºßºßßóßó¡¹µÈÄâÉù´Ê¶ÎµÄÐÄÀí·´ÏìÊý¾Ý£¬¹¹½¨Æð¶¯Ì¬µ÷½âµÄÇéÐ÷Ë㷨ģ×Ó¡£ÔÚ°ü¹ÜÎÄ»¯ÊÊÅäÐÔµÄÌõ¼þÏ£¬¸ÃÊÖÒÕÒÑÀÖ³ÉÒÆÖ²µ½¶«ÄÏÑÇÓïÖÖÂþ»ÖУ¬ÊµÏÖ´Ó¼òµ¥ÄÚÈÝÊä³öµ½ÊÖÒÕ±ê×¼Êä³öµÄÕ½ÂÔÉý¼¶£¬Îª±¾ÍÁIPµÄÈ«Çò»¯ÔËÓª¿ª·¢Ð·¾¶¡£
´ÓÄÚÈÝ·ºÆðµÄÊÖÒÕͻΧµ½ÉÌҵģʽµÄÁ¢ÒìÖØ¹¹£¬BilibiliÂþ»ÕýÔÚÌÜдÖйúÊý×ÖÔĶÁµÄз¶Ê½¡£Æäͨ¹ý¡¸ÔÉùÎÞµ¯´°¡¹½â¾ö¼Æ»®ÊµÏֵĸйÙÉýά£¬²»µ«ÖØÐ½ç˵ÁËÇ×Ãܳ¡¾°µÄÒÕÊõ±í´ï±ê×¼£¬¸üÔÚ¹¤Òµ²ãÃæ´î½¨ÆðÅþÁ¬´´×÷ÕßÓëÓû§µÄÐÅÈÎÇÅÁº¡£ÕâÖÖ¼æ¹ËºÏ¹æÉú³¤ÓëÊÖÒÕÁ¢ÒìµÄƽºâÖ®µÀ£¬»ò½«ÒýÁìÕû¸öÔÚÏßÔĶÁÐÐÒµ½øÈëÌåÑ龼õÄмÍÔª¡£µÚÒ»Õ£ºÉùÒôÊÕÂÞÊÖÒÕµÄÍ»ÆÆÐÔ½ø»¯
½ñÊÀ¼Òô×°±¸Í¨¹ý192kHz/32bitµÄ³¬¸ßÒôƵ²ÉÑùÂÊ£¨Audio Sampling Rate£©£¬¾«×¼²¶»ñ´½³Ý½Ó´¥Ê±0.5-12kHzµÄÌØÕ÷ƵÂÊ´ø¡£Ë«ÕñĤµçÈÝÂó¿Ë·ç½ÓÄÉרÀûÐÔÐÄÔàÐÎÖ¸ÏòÉè¼Æ£¬ÔÚÏû³ý30cmÍâÇéÐÎÔëÒôµÄͬʱ£¬ÍêÕû±£´æ0.3ÃëÄÚÓÉÇá´¥µ½ÉîÈëµÄÉùѹ½¥±äÀú³Ì¡£¹¤³ÌʦÍŶӿª·¢µÄ¶¯Ì¬½µÔëËã·¨£¨Dynamic Noise Reduction£©¿ÉÖÇÄÜʶ±ð²¢ÊèɢĿµÄÉùÔ´£¬Ê¹µÃÎÞÅä¾°ÒôÀÖÂ¼ÖÆ³¡¾°ÖеÄÈËÉù´¿¾»¶È´ï98.7%¡£
µÚ¶þÕ£º¿Õ¼äÉù³¡»¹ÔµÄÒªº¦Á¢Òì
×îа汾Å䱸µÄ3DÉùÏñ¶¨Î»ÏµÍ³£¬Í¨¹ýHRTFÍ·²¿Ïà¹Ø´«Ê亯Êý£¨Head-Related Transfer Function£©×¼È·Ä£ÄâÌý¾õ¿Õ¼ä¡£ÔÚÇ×ÃÜÆø·ÕÌåÑé²âÊÔÖУ¬85%µÄÊÜÊÔÕß¿É׼ȷÅжÏÉùÔ´¾àÀëÎó²îСÓÚ2cm¡£ÅäºÏ¿ÕÆø´«µ¼Ä£ÄâÊÖÒÕ£¬Á¢ÒìÐÔµØÔÙÏÖÎÂÈȺôÎüÂÓ¹ý¶úÀªÊ±ÌØÓеÄ20Hz´ÎÉù²¨Õñ¶¯£¬ÕâÖÖÌÕ×íʽÌåÑéÈôóÄÔÐÓÈʺ˻îÔ¾¶ÈÌáÉý37%£¬ÇéÐ÷¹²Ê¶Ð§ÂÊÔ¶³¬¹Å°å¼Òô·½·¨¡£
µÚÈýÕ£º×°±¸ÉèÖÃÓë²ÎÊýÓÅ»¯Õ½ÂÔ
ҪʵÏÖÉàÎÇÔÉù³¬ÇåÎúÂ¼ÖÆ£¬½¨Òé½ÓÄÉ×éºÏʽʰÒô¼Æ»®£ºÖ÷Âó¿Ë·çѡרÐÄÐÍÖ¸ÏòרҵµçÈÝÂ󣬸¨ÒÔÌùÉíʽ¹Çµ¼´«¸ÐÆ÷ÊÕÂÞò¢¹ÇÕð¾ªÐźš£²ÎÊýÉèÖ÷½Ã棬½«ÔöÒæ¿ØÖÆÔÚ-18dBÖÁ-12dBÇø¼ä£¬ÅäºÏ80Hz¸ßͨÂ˲¨¿ÉÓÐÓÃÏû³ýÊÖ³ÖÔëÒô¡£²âÊÔÊý¾ÝÏÔʾ£¬µ±ÐÅÔë±È£¨SNR£©ÌáÉýÖÁ75dBʱ£¬ÌýÖÚ¶ÔÇ×Ãܳ¡¾°µÄÕæÊµ¸ÐÆÀ¼ÛÌá¸ß2.3±¶¡£
µÚËÄÕ£ººóÆÚ´¦Öóͷ£µÄÖÇÄܽµÔë¼Æ»®
»ùÓÚÉî¶ÈѧϰµÄÉùÒôÊèÉ¢ÊÖÒÕ£¨Deep Learning Audio Separation£©ÔÚ×îа汾ÖÐÌåÏÖÓÈΪͻ³ö¡£Ë㷨ͨ¹ý3000СʱµÄÕæÕæÏàÐÎѵÁ·Ñù±¾£¬¿Éʶ±ð²¢Ïû³ý96Àà³£¼ûÇéÐÎÔëÒô£¬Í¬Ê±¼á³ÖÄ¿µÄÉùÔ´µÄÏàλһÖÂÐÔ¡£ÔÚ´¦Öóͷ£Ç×ÎÇÔÉùʱ£¬ÖÇÄÜÆ½ºâÆ÷»á¶¯Ì¬Ç¿»¯500-2000HzƵ¶Î£¬ÕâÊÇ´½²¿½Ó´¥Ê±Éù²¨·´ÉäµÄÖ÷񻂿Óò£¬Ê¹Ã¿´¦Ï¸½Ú¶¼Ï˺Á±ÏÏÖ¡£
µÚÎåÕ£ºÏÖʵӦÓ󡾰ЧÄÜÑéÖ¤
ÔÚÓ°ÊÓ¾çͬÆÚÉùÂ¼ÖÆ²âÊÔÖУ¬ÐÂÐÍ×°±¸Àֳɽ«ÇéÐε×Ôë´Ó-60dB½µµÍÖÁ-82dB£¬µ¼ÑÝ×é¶ÔÇ×ÃÜÏ··ÝµÄÉùÒôÕæÊµ¶ÈÖª×ã¶È´ï92%¡£ÇéÐ÷ÐÄÀí×Éѯ»ú¹¹·´ÏìÏÔʾ£¬Ê¹Óó¬ÇåÎúÔÉùËØ²Äºó£¬À´·ÃÕßµÄÇéÐ÷´úÈëЧÂÊÌáÉý41%¡£¸üÖµµÃ¹Ø×¢µÄÊÇ£¬ÔÚASMRÄÚÈÝÁìÓò£¬ÎÞÅä¾°ÒôÀÖ°æ±¾µÄÓû§Æ½¾ùÍ£Áôʱ³¤ÑÓÉìÖÁ7·Ö23Ã룬Íê²¥ÂÊÌá¸ß28%¡£
´ÓÊÖÒÕ²ÎÊýµ½ÇéÐ÷¹²Ê¶£¬ÉàÎÇÔÉù³¬ÇåÎúÎÞÅä¾°ÒôÀÖµÄÁ¢Òì±ê¼Ç×ÅÉùÒô¹¤³ÌÓëÈËÎÄÐèÇóµÄÉî¶ÈÁ¬Ïµ¡£×îа汾ͨ¹ýƵÆ×ÖØ×éËã·¨£¨Spectrum Reconstruction Algorithm£©ºÍÐÄÀíÉùѧÑо¿£¬½«Ç×ÃÜÆø·ÕÌåÑéµÄÕæÊµ¶ÈÍÆÏòÐÂά¶È¡£ÕâÖÖ¿çÔ½ÊÖÒÕ½çÏßµÄ̽Ë÷£¬²»µ«Îª×¨ÒµÁìÓòÌṩ½â¾ö¼Æ»®£¬¸üÖØÐ½ç˵ÁËÈËÀà¶ÔÇ×ÃÜÉùÒôµÄ¸ÐÖª·½·¨¡£