Utau Como usar UTAU, crear uno y configurarlo (incluye bancos de voz CV, VCV y CVVC) + otra info

SpanishPandaHero

Apologize to the funyarinpa!

Registrado
25 Mar 2012
Mensajes
150
Ubicación
Antártida
Offline
UTAU es sintetizador de voz japonés similar a VOCALOID, pero con la peculiaridad de que el usuario puede crear su propio cantante a partir de su voz.
Gracias a esto el usuario tiene a su disposición una amplia gama de voces que se pueden conseguir a través de internet (especialmente por YouTube, Nico Nico Douga y Soundcloud), la mayoría de forma gratuita y dedicados (a también) una amplia gama de idiomas.

Antes que nada, lo básico:

  • - Descargar el programa en cuestión. Disponible para Windows y para MAC .
  • - Antes de instalar el programa, es recomendable poner la locale de la computadora en japonés (Panel de Control -> Región -> Administrativo -> Idioma para programas no Unicode -> Japonés )
  • - Si tiene un sistema operativo inferior a Windows 7, es probable que no tenga instalado el japonés. Lo pueden conseguir acá XP_Japanese_Pack_Windows
  • - El programa por defecto suele venir en inglés o japonés. Si lo quieren en español pueden conseguir el parche para español acá res(esp) (Para instalarlo, borrar la carpeta "res" que se encuentra dentro de la carpeta "UTAU" y poner la carpeta "res" que se encuentra dentro del zip que has descargado.)
  • - Será necesario un programa de edición de audio para mixear (juntar el acapella con el instrumental y añadir efectos) las canciones hechas con UTAU y para las grabaciones en el caso de que se quiera crear un cantante. Mi recomendación sería Adobe Audition (Es de pago. Pero taringa y google son vuestros amigos) y Audacity (que es gratuito y lo pueden obtener acá Descargar Audacity ) A la hora de grabar el banco de voz es muy importante el eliminar el vídeo y normalizar el audio. Los archivos deben guardarse en formato wav. Para grabar también está bien Oremo
  • - Si además quieren crear un vídeo para subirlo a alguna web cómo You Tube o Vimeo, mi recomendación va para el Sony Vegas y el Adobe After Effects. Pero si lo que quieren es algo gratuito, el Windows Movie Maker tampoco está mal.

Elementos del programa:



  1. La barra de herramientas principal: La flecha sirve para seleccionar, el lapicero para añadir notas, la lupa con el + para hacer zoom acercando, la lupa con el - para hacer zoom alejando, la flecha de la izquierda te manda al inicio del documento, la flecha de la derecha al final del proyecto.
  2. Espacio para añadir la letra que se quiera poner en las notas.
  3. La barra de herramientas secundaria: El cuadro blanco sirve para añadir la letra escrita en el cuadro del punto 2 (se deben seleccionar las notas en las que se quiera añadir la letra), el cuadro rosa para crear nuevas notas con la letra escrita en el cuadro del punto 2 y el cuadro de la R sirve para añadir notas de silencio.
  4. La barra de edición de envolturas: ACPT sirve para añadir un ajuste de envoltura automatico para cada nota seleccionada según el oto.ini, P2P3 y P1P4 sirve para suavizar el final y principio de las envolturas de las notas seleccionadas, OPT sirve para eliminar la memoria caché de las notas seleccionadas de ese documento y RESET sirve para resetear las envolturas de las notas seleccionadas.

Os lo dejo en pestañas para que no sea tan lioso, pinchad en la que queráis


    Cómo crear y usar bancos de voz CV, VCV y CV VC en UTAU Flags Resamplers y Wavtools



    • Cómo crear y usar bancos de voz CV, VCV y CV VC en UTAU

      CV= Consonante Vocal (ka, ba, che, zo, etc..)
      VCV= Vocal Consonante Vocal (a ka, e ba, i cho, a zu, etc..)
      CV VC= Consonante Vocal + Vocal Consonante ( ka + a k, bi + i ch, ya + a n, etc..)

      Lo siguiente que voy a explicar lo explique en vídeo hace un par de meses. Dejo el vídeo por si alguien prefiere verlo en vídeo en vez de leerlo o quiere un ejemplo visual: (en la descripción del vídeo se puede encontrar un índice con el minuto exacto de cada cosa)

      Lo pongo en spoiler porque es bastante texto e imágenes.

      Para grabarlos:
      Os dejo un reclist japonés CV en un zip que incluye un oto.ini con el hiragana ya puesto (para que no tengáis que ponerlo) CV_reclist+oto_hiragana__.zip
      Si solo quieren el reclist dejo la lista acá:
      a あ - e え - i い - o お - u う - n ん
      ba ば - be べ - bi び - bo ぼ - bu ぶ
      cha ちゃ - che ちぇ - chi ち - cho ちょ - chu ちゅ
      da だ - de で - di ぢ(でぃ) - do ど - du づ
      fa ふぁ - fe ふぇ - fi ふぃ - fo ふぉ - fu ふ
      ga が - ge げ - gi ぎ - go ご - gu ぐ
      ha は - he へ - hi ひ - ho ほ - hu
      ja じゃ - je じぇ - ji じ - jo じょ - ju じゅ
      ka か - ke け - ki き - ko こ - ku く
      ma ま - me め - mi み - mo も - mu む
      na な - ne ね - ni に - no の - nu ぬ
      sha しゃ - she しぇ - shi し- sho しょ - shu しゅ
      ra ら - re れ - ri り - ro ろ - ru る
      pa ぱ - pe ぺ - pi ぴ - po ぽ - pu ぷ
      ta た - te て - ti てぃ - to と - tu とぅ
      sa さ - se せ - si せぃ - so そ - su す
      tsu つ
      wa わ - we うぇ - wi うぃ- wo を - wu
      ya や - ye いぇ - yi いぃ - yo よ - yu ゆ
      za ざ - ze ぜ - zi - zo ぞ - zu ず
      mya みゃ - mye みぇ - myo みょ - myu みゅ
      hya ひゃ - hye ひぇ - hyo ひょ - hyu ひゅ
      rya りゃ - rye りぇ - ryo りょ - ryu りゅ
      pya ぴゃ - pye ぴぇ - pyo ぴょ - pyu ぴゅ
      kya きゃ - kye きぇ - kyo きょ - kyu きゅ
      nya にゃ - nye にぇ - nyo にょ - nyu にゅ
      bya びゃ - bye びぇ - byo びょ - byuびゅ



      EXTRA

      tsa - tse - tsi - tso - rr - s - m
      la - le - li - lo - lu
      rra - rre - rri - rro - rru (rolled r - doble r)
      va ヴぁ - ve ヴぇ - vi ヴぃ - vo ヴぉ - vu ヴ

      Esto debe grabarse por separado, es decir "a" en un archivo separado, "be" en otro, etc...
      Las grabaciones deben quedar lo más largas posible. (de 1 segundo de duración cómo mínimo)
      A la hora de recortarlas para guardarlas, dejar algo de espacio al principio del sonido.
      No olvidarse de que deben guardarse en formato wav.

      Para configurarlos: (hacer el oto.ini)

      Básico:
      Las zonas azul (offset y cutoff) son las que queremos que no suenen de ese fonema.
      La zona rosada (Consonant) es la parte de la grabación que queremos que el programa no alargue.
      La barra roja (Preutter) sirve para indicar dónde termina la consonante.
      La barra verde (overlap) sirve para indicar hasta que parte se quiere que la nota de esa grabación se sobreponga a la nota anterior.


      Las vocales (a e i o u n)


      Se cubre principio y final con la zona azul, la consonante y una pequeña parte de la vocal se debe cubrir con la zona rosada y se ponen la barra verde y roja dentro de la rosada, no muy lejos (Importante, la barra verde debe quedar la primera).

      Las consonantes cortas (p- k- t- normalmente)



      Se cubre el final con la zona azul y parte del silencio al principio, la consonante y una pequeña parte de la vocal se debe cubrir con la zona rosada, se debe poner la barra verde al inicio del sonido consonante y la roja al final del sonido consonante.
      Es recomendable dejarle ese pequeño silencio delante del sonido consonante. (la razón es que este tipo de consonantes se suelen pronunciar con un breve silencio antes. Cómo por ejemplo para la palabra "picadillo" se dice pi-cadillo)

      Las consonantes largas y medianas



      Se cubre el final con la zona azul y todo el silencio del principio (si la consonante es demasiado larga y se escucha bien aunque se corte un pedazo, pueden marcar esa parte de la consonante en azul), la consonante y una pequeña parte de la vocal se debe cubrir con la zona rosada, se debe poner la barra verde casi al inicio de la consonante y la roja al final del sonido consonante.



      En el caso de que la consonante sea muy larga (y no quiera o no se pueda acortar más con la zona azul) es recomendable poner la barra verde a la mitad de la consonante. Esto normalmente suele pasar en las consonantes f-, sh-, s- y ts-

      Si en algún momento hay alguna duda sobre dónde acaba la consonante, pinchad al botón S.
      Aunque cada consonante y vocal tiene una forma de espectro diferente, normalmente sirve para hacerse una idea de qué es qué.

      Otra cosa muy importante, en los fonemas CCV (cómo kya, byo, mye, etc...) la zona rosada debe marcar también la zona de la "y" y parte de la vocal. De forma de que quedase cómo myaaaaaaaaa.

      Cómo usarlos:

      Antes que nada, con el archivo UST abierto, seleccionar todo y darle al botón RESET.
      Con todo seleccionado todavía, dar click detecho sobre cualquier nota y clickear en "propiedad de la región" y poner la modulación a 0, limpiar el pretterance y overlap, darle doble click al STP si está en gris o borrar el número si hay.
      La velocidad de la consonante no es necesaria en los bancos de voz CV, pero si el tempo es rápido, puedes ponerle un número entre 120 y 160.
      Y click en aceptar.

      Luego hay que pinchar los botones de la barra de envolturas (en este orden) ACPT, P2P3 y ACPT otra vez.
      Y aplicar el crossfade (Herramientas -> Herramientas integradas -> Crossfade) nos aseguramos de que en el espacio estén todas las vocales en hiragana y que el UST está escrito en hiragana. (En el caso de estar en romaji, lo mejor es convertirlo al hiragana con este plugin romantokana ) Y aplicamos el crossfade. Y ya estaría listo para ser renderizado (en el caso de que no quieras tunear o editar más el UST)

      Si el UST está diseñado para VCV, lo podeís convertir a CV con el suffixbroker o con este plugin back2cv.zip
      Para grabarlos:
      Os dejo un reclist japonés VCV en un zip junto a un oto base VCV_reclist+oto_hiragana+romaji__.zip
      Estos bancos de voz se graban por frases, cada frase debe grabarse junta y fluida, y guardarse cada frase por separado con el nombre de la frase.
      No os olvidéis de guardarlo en formato wav.
      A la hora de grabar este tipo de bancos de voz yo recomiendo hacerlo usando un metrónomo o una BGMGuide. Os dejo la que yo uso para grabar: One note Jazz.zip
      Y un oto base que hice de un banco de voz grabado con una BGMGuide de 90 t
      oto base japanese 90t
      Si no tenéis oto base, podéis generar uno automáticamente usando setparam

      Os dejo varios reclist VCV que os pueden resultar utiles:

      VCV Japonés
      VCV Español
      VCV Español lite (Para añadirlo a un vcv japonés)

      Para configurarlos: (hacer el oto.ini)

      Básico:
      Las zonas azul (offset y cutoff) son las que queremos que no suenen de ese fonema.
      La zona rosada (Consonant) es la parte de la grabación que queremos que el programa no alargue.
      La barra roja (Preutter) sirve para indicar dónde termina la consonante.
      La barra verde (overlap) sirve para indicar hasta que parte se quiere que la nota de esa grabación se sobreponga a la nota anterior.

      Las partes CV (las que llevan una - delante) se configuran igual que un CV (aunque hay gente que prefiere ponerle algo de silencio delante a todas las partes CV de los VCV, yo no lo hago.)

      Los VCV son más sencillos de configurar que los CV, pues todas las partes VCV se configuran igual independientemente de las vocales o consonantes que lleven.

      Ejemplo:



      La zona azul debe cubrir todo menos el final de la vocal anterior y la silaba siguiente, la raya verde y roja no se deben mover, se debe de agarrar de la parte azul y tirar de ella hasta que la raya roja quede detrás de la consonante) Yo siempre mantengo las rayas a 300 y 100 (300 Preutterance y 100 el Overlap) la única razón para moverlas sería en el caso de que al encajar la raya roja no quede sonido vocal al principio (porque la consonante es muy larga), por lo que en ese caso está bien si se mueve un poco la raya roja para que haya sonido vocal y la raya roja pueda estar en su lugar.



      Aquí por ejemplo la tuve que poner a 398 y 100. (intentad pronunciar las consonantes todo lo cortas que podáis, no seáis como yo)

      En los diptongos (cómo a e), la raya roja debe quedar entre el final de la primera vocal y el principio de la siguiente.
      Recordad que el alias de los bancos VCV es diferente: De una frase cómo ka_ka_ke_ke_ki_ki_ko debéis sacar:

      - ka
      a ka
      a ke
      e ke
      e ki
      i ki
      i ko

      y el hiragana es diferente, debe ir la primera vocal en romaji y el resto en hiragana:

      - か
      a か
      a け
      e け
      e き
      i き
      i こ

      Cómo usarlos:

      Antes que nada, con el archivo UST abierto, seleccionar todo y darle al botón RESET.
      Con todo seleccionado todavía, dar click detecho sobre cualquier nota y clickear en "propiedad de la región" y poner la modulación a 0, limpiar el pretterance y overlap, darle doble click al STP si está en gris o borrar el número si hay.
      La velocidad de la consonante es recomendable usarla en los bancos de voz VCV, entre 140 - 160 estaría bien.
      Y click en aceptar.

      Luego hay que pinchar en el botón P2P3 de la barra de envolturas con todo seleccionado.
      Y ya está.

      Si el UST está en CV, lo podéis pasar a VCV usando este plugin Lyric Diphonizer.zip
      Para grabarlos:

      Depende del reclist, algunos están en frases cómo los VCV y se deben grabar cómo uno,
      ka_ke_ki_ko_ku_k
      y otros son cómo CV pero con un sonido consonante al final
      kak

      Este tipo de bancos de voz son especialmente usados para idiomas que no son el japonés, pero últimamente se está popularizando el uso de estos para el japonés también (debido a que dan buena fluidez y tardas menos en configurarlos que un VCV )

      Os dejo algunos reclists:

      CV VC Japonés
      CV VC Español
      CV VC Japonés
      (sí otro, pero este viene con un UTAU ya hecho, varios preset para el plugin convertor a CV VC y un oto base)
      CV VC Catalán (Contiene algo de VCV)
      CV VC Español (sí, otro, pero contiene partes VCV también)
      CV VC Inglés (Y si prefieren las frases cómo CV)

      Para configurarlos: (hacer el oto.ini)

      Básico:
      Las zonas azul (offset y cutoff) son las que queremos que no suenen de ese fonema.
      La zona rosada (Consonant) es la parte de la grabación que queremos que el programa no alargue.
      La barra roja (Preutter) sirve para indicar dónde termina la consonante.
      La barra verde (overlap) sirve para indicar hasta que parte se quiere que la nota de esa grabación se sobreponga a la nota anterior.

      Las partes CV van cómo un CV normal.
      Las partes VC van parecido a la configuración de un VCV:





      El Preutterance debe estar a 300 y a 100 el Overlap en todas las partes VC.
      La zona rosaba debe cubrir la vocal y la consonante completamente. y debe quedar el espacio blanco pequeño, con solo un trozo del final de la consonate y del inicio de la siguiente vocal.
      (cómo las notas VC deben ser muy cortas, ese último sonido vocal no sonará)



      Si la consonante es muy larga, se puede poner la zona rosada hasta la mitad de la consonante y dejar la otra mitad en la zona blanca sin el sonido vocal siguiente.
      Con consonantes cómo m y n, esto último es recomendable hacerlo, incluso si la consonante no es larga.

      No os olvidéis de que el alias de las partes VC van siempre en romaji.

      Cómo usarlos:

      Antes que nada, con el archivo UST abierto, seleccionar todo y darle al botón RESET.
      Con todo seleccionado todavía, dar click detecho sobre cualquier nota y clickear en "propiedad de la región" y poner la modulación a 0, limpiar el pretterance y overlap, darle doble click al STP si está en gris o borrar el número si hay.
      La velocidad de la consonante es recomendable usarla en los bancos de voz CV VC (Por las partes VC, en realidad), entre 140 - 160 estaría bien.
      Y click en aceptar.

      Luego hay que pinchar en el botón P2P3 o en el de P1P4 de la barra de envolturas con todo seleccionado.
      Y ya está.


      Sin embargo hay muy pocos UST en CV VC, la mayoria son en VCV o CV. Por eso hay un plugin que convierte USTs de estos 2 tipos a CV VC: autocvvc_1.23.zip
      Este plugin necesita de diccionarios llamados "preset" para funcionar. Los preset son archivos txt que se deben colocar en la carpeta "preset" que se encuentra dentro de la carpeta de este plugin.
      Os dejo unas cuantas por si las queréis:

      Preset japonés romaji
      Preset japonés hiragana
      Varios preset japonés hiragana
      Preset español

      El plugin está en japonés por defecto, si lo quieren en español pueden encontrar un parche en el mismo rar del preset para español.

      De igual manera, también se pueden añadir las partes VC de forma manual. Lo recomendable es ponerlas cómo puente entre las notas CV. Por lo que si queremos poner "konnichiwa" quedaría cómo:

      ko o n ni i ch chi i w wa

      o en hiragana:

      o n i ch i w

      También pueden usar el presamp y quitarse de problemas (explico sobre el presamp al final de la pestaña de "resamplers y wavtools".

    • Las flags son una serie de letras y números que se añaden a la configuración de un proyecto de UTAU (UST) para darle un efecto u otro a la voz del cantante (Más suave, más clara, más aguda, etc...)

      Se pueden añadir flags al programa de 2 formas:


      1º De esta forma, las flags que se añadan afectaran a todo el UST:

      Clickeamos en el nombre del cantante (el que está bajo la imagen del UTAU de la izquierda)
      o vamos a Proyecto -> Propiedades del proyecto.






      2º De esta forma, las flags que se añadan solo afectaran a las notas que seleccionemos:



      (Aunque también se puede ir desde Edición -> Propiedad de la región.)


      Visto esto, dejo aquí algunas flags:


      g -> (Su acompañamiento es entre -100 y 100)

      Esta flag sirve básicamente para cambiar el gender factor de una voz.
      El + sirve para hacer las voces más graves. Por ejemplo: g+40 haría una voz más grave que g+30.
      El - sirve para todo lo contrario, hace que las voces suenen más agudas. Por ejemplo: g-20 sonará menos aguda que g-60.

      Esta flag es la famosa flag utilizada para crear los "genderbends" de los Utaus (Véase en Ted Kasane, Namine Ritsuko, etc...)


      t -> (Su acompañamiento es entre -99 y 99)

      Esta flag simplemente aumenta o desciende el pitch. (Los que estén familiarizados con el programa VOCALOID se harán una idea del efecto de esta flag. Pero los que no, que sepan que provoca un efecto cómo de subida o bajada de tono.) Y no, con esta flag no se debe editar el pitch/tunear en UTAU.

      Ejemplos: t-50 provoca tonos más bajos que t80.


      Y -> (Su acompañamiento es entre 0 y 100)

      Esta flag principalmente lo que maneja es claridad.
      Por ejemplo: Y0 sonará más clara que Y50.
      Una cosa a tener en cuenta, a veces al acompañar la flag Y con el cero (Y0), puede provocarse un leve ruido y hacer que las notas altas suenen metálicas. Si esto te pasa, es recomendable no usarla.


      H -> (Su acompañamiento es entre 0 y 99)

      Esta flag hace sonar una nota más fuerte que otra.
      En teoría con esta flag se puede arreglar el ruido que aparece en las notas altas, pero puede provocar un efecto apagado en las notas.
      Por ejemplo: H70 sonará menos fuerte que H0.


      h -> (Su acompañamiento es entre 0 y 99)

      Sirve para hacer sonar como un susurro. (En teoría.)
      Si se añade demasiado valor al acompañamiento de la flag la voz puede sonar cómo ronca.
      Por ejemplo: h99 sonará más suave (Y seguramente más ronca.) que h10.


      F -> (Su acompañamiento es entre 0 y ¿?)

      En teoría esta flag edita la fuerza del filtro formante que a su vez depende de la frecuencia llamada "fuente de frecuencia" (O algo así)
      Esto no es recomendable usarlo, pero si la voz suena con ruido en las notas altas, lo puedes arreglar añadiendo esta flag con un acompañamiento de más o menos F4, F7... (Números no muy altos.)


      L -> (Su acompañamiento es entre 0 y ¿?)

      En teoría tiene el mismo efecto que la F.
      Si se usan ambas flags (F y L) la flag L tiene preferencia a la F.


      b -> (Su acompañamiento es entre 0 y 100)

      Esta flag da un efecto áspero a la voz.
      Por ejemplo: b10 sonará menos áspero que b80.


      C -> (Su acompañamiento es entre 0 y 100)

      En teoría reduce las altas frecuencias.

      BRE -> (Su acompañamiento es entre 0 y 100.)

      Provoca una respiración dificultosa. (El valor de BRE también se puede poner desde la ventana de Propiedad de la región.) Por defecto este valor es de 50.

      W -> (Su acompañamiento no se especifica.)

      Esta flag da un sonido robotico a la voz.
      Es una flag que no se suele usar mucho porque está todavía en fase beta.


      N -> (Su acompañamiento no se especifica.)

      Básicamente da un efecto de voz "ardilla". (Como si le añadieses un alto acompañamiento a la flag g- )

      Recomendación personal: No uséis las flags N y W juntas. Aunque suenan como un juego en 8-bits, acaban dando dolor de cabeza (O por lo menos a mí)


      X -> (Su acompañamiento es entre 0 y 99.)

      Hace la voz con efecto "whisper".
      Por ejemplo: X99 suena más whisper que X10.
      (Si se quiere oír decentemente la nota, es recomendable usar un acompañamiento bajo en esta flag, O directamente no usarla. Usar un banco de voz "whisper" es mejor idea que usar esta flag, probablemente)


      ------------------------------------

      Estas son las flags de las que tengo conocimiento.

      Sobra decir que el efecto final de cada flag tiene que ver con el tipo de voz y a veces con el resampler que usemos, solo hay que ir probando y mezclando flags hasta que demos con el resultado adecuado que queremos para ese UTAU. (Además hay flags que funcionan de forma diferente o no funcionan en algunos resamplers)


      Si alguien conoce alguna flag más, que me lo diga para que pueda añadirla a la lista.

    • Los resamplers y wavtools son las herramientas que el programa UTAU usa para generar el canto, es decir son el motor del programa. Depende de que herramientas uses el resultado de la voz al ser sintetizada puede ser uno u otro.


      Para abrir la ventana dónde elegir el resampler y wavtool hay que clickear en el nombre del cantante (el que está bajo la imagen del UTAU de la izquierda) o ir a Proyecto -> Propiedades del proyecto.

    Resamplers y Wavtools


      1. Acá es dónde se elige la primera herramienta, es decir el wavtool que queremos usar. Por defecto viene el "wavtool.exe", a mí me sale el wavtool4vcv porque es el que yo puse por defecto.
      2. Acá es dónde se elige la segunda herramienta, es decir el resampler que queremos usar.
        Por defecto viene el "resampler.exe".​
      3. Si pinchamos en ese cuadrado usaremos el resampler.dll. No recomiendo usarlo.
      Si si quieren cambiar el wavtool y resampler por defecto, se puede hacer desde Herramientas -> Opciones -> La penúltima pestaña -> Y en la herramienta 1 buscan el wavtool que quieran y en la herramienta 2 el resampler que quieran.



      Aquí va la lista con una breve descripción y con sus links de descarga:

      Wavtools:

      Wavtool:

      (El que viene por defecto con el programa.): La última versión de esta herramienta es la que viene con el Utau 0.4.18.
      Es realmente básico, y creo que a rasgos generales no tiene mucho de especial. Es el que la mayoría de la gente usa.

      El link de descarga sería el del
      UTAU 0.4.18


      Wavtool4vcv: Es igual que el de por defecto, pero aparentemente da mayor fluidez a los bancos de voz VCV y CV VC.
      El link de descarga: wavtool4vcv


      Wavtool2: Si no recuerdo mal, su única función es que el plugin "envedit2" funcione.
      El link de descarga (junto al plugin envedit2):
      wavtool2

      Resamplers:

      Antes que nada, dejo el link de un parcheador para los resamplers (hace que vayan más rápido y a veces soluciona problemas de compatibilidad) Yo recomiendo parchear todos los resamplers que vayas a usar para quitarte de posibles problemas.
      resampler_patcher1.4.zip

      Resampler (El que viene por defecto con el programa.): La última versión de este resampler es la que viene con el Utau 0.4.18.
      Es realmente básico, y creo que a rasgos generales no tiene mucho de especial...A excepción de que con esta última actualización este resampler se ha vuelto un resampler de carga bastante rápida. (Que tarda menos en correr los fonemas.)
      Dicen que da un aire "robotico" a los Utaus, pero yo sinceramente no noto gran cosa.
      El link de descarga sería el del
      UTAU 0.4.18

      Resampler.dll (Otro que viene por defecto con el programa): La última versión de este resampler es la que viene con el Utau 0.4.18.
      Es muy básico. A diferencia de los demás no usa caché y carga muy rapidamente. Sin embargo se buguea con mucha facilidad. No recomiendo su uso.
      El link de descarga sería el del
      UTAU 0.4.18


      Fresamp:
      Según tengo entendido, su última versión es la 0.14.
      Elimina medianamente el ruido y refuerza los fonemas, pero, provoca un efecto nasal en notas altas (Aunque según comentan, en esta nueva versión las notas altas suenan mejor). Además, suele tardar un poco más de lo normal en renderizar...¡Pero no hay que desesperarse! Puede que de todas formas te guste el efecto que da a la voz.


      El link de descarga sería este: Fresamp14.zip
      Si quieren el antiguo fresamp, lo pueden conseguir aquí: Fresamp.zip


      TIPS:
      De momento se encuentra en versión beta.
      Es realmente bueno en los bancos de voz suave y en notas altas. Aunque pueden provocar una voz metalica y algo de ruido. (Nada que no se pueda solucionar con una flag como F0B0)
      Este resampler crea archivos .pmk (A diferencia del resampler normal, que crea archivos .frq)
      Sinceramente, a mí me gusta como suena este resampler, da bastante claridad a las voces.
      El link de descarga sería este:
      TIPS.zip

      EFB-GW:
      También conocido como WORLD.
      Es necesario tener instalado el FFTW para usarlo (Lo puedes descargar aquí: FFTW Installation on Windows)
      De este no puedo decir mucho...Solo que puede resultar un poco lioso ya que tiene varias carpetas y archivos dentro del rar (imagino que para que funcione ese resampler...) Yo nunca lo he utilizado (Porque no me funciona, directamente) ni lo he escuchado, así que no sé muy bien que efectos dará. Hay gente que dice que solo funciona en computadoras japonesas, tal vez sea cierto.
      El link de descarga sería este:
      WORLD 0.2.0_3.ZIP

      World4utau:
      O también conocido como W4U (World for UTAU).
      Le he escuchado, y a mí opinión da bastante ruido a la voz. Parece ser que requiere también de archivos FFTW para poder funcionar.
      El link de descarga sería este:
      w4u001.zip

      bkh01:
      Actualmente en la versión 0.55.
      Este es otro resampler que me gusta bastante su sonido.
      Suele dar un efecto más real a las voces (Aunque todo depende de las flags que uses y el banco de voz al que lo apliques.) Funciona bastante bien en bancos de voz suaves.
      Y como todo lo bueno, tiene una pega, y es que puede crear distorsión, efectos metálicos y efectos nasales en las voces.
      La última vez que lo usé, el efecto que le dió a la voz fue algo como un "append serious" (La voz con la que lo usé fue una voz aguda femenina.)

      Aparentemente está dando problemas en sistemas operativos nuevos. Si os da problemas, mi recomendación es usarle con un Windows XP SP3 (Yo lo tengo virtualizado con virtualbox), igual me da la sensación de que los problemas pueden estar relacionados con que puede que los wavs estén guardados en estéreo y a más de 16 bits. (Por curiosidad, si alguien lo prueba con un UTAU así y no le funciona o le funciona, que me lo diga).

      El link de descarga sería este: [/COLOR]bkh01_055.zip

      tn_fnds:
      Este también requiere de archivos FFTW para funcionar.
      El resultado me recuerda mucho al de TIPS, claro y limpio. La única pega es que a veces quiebra la voz.
      No funciona con fonemas grabados en estéreo.

      Lo pueden descargar aquí:
      tn_fnds009.zip

      EFB-PB:
      Muy parecido al tn_fnds, funciona bien con voces suaves. Pero al igual que el tn_fnds quiebra a veces la voz. (aunque menos que el tn_fnds, eso sí)
      Aparentemente necesita el resampler EFB-GW (WORLD) para funcionar.
      Lo pueden descargar aquí:
      EFB-PB.exe

      EFB-GT:
      Hace sonar las voces firmes y claras, sin embargo crea un leve ruido al fondo.
      Lo pueden descargar aquí:
      EFB-GT(2013/01/10).exe

      Phavoco:
      (Anteriormente llamado "favoco6")
      Da un sonido bastante robotico a la voz. Junto a una buenas flags puede servir para crear voces roncas.
      Lo pueden descargar aquí:
      phavoco10.zip

      WARP:
      No lo he probado mucho, pero me da una sensación de solidez en la voz.
      Puede provocar un efecto de voz ronca o con ruido, aunque si luego el instrumental es bastante fuerte, esto seguramente ni se note.
      Según parece, este resampler corre bastante rápido.
      Lo pueden descargar aquí:
      WARP.exe

      VS4U:
      Hace unos meses salió la versión 1.41, creo que es el resampler actualizado más recientemente.
      Da sensación de solidez y claridad en la voz.
      Aparentemente esta nueva versión tienen flags propias nuevas:
      T - Igual que la flag t normal (acompañamiento de -2400 a 2400, por defecto está a 0)
      O - Brillo (acompañamiento de -100 a 100, por defecto está a 0)
      S - Claridad (acompañamiento de -100 a 100, por defecto está a 0)
      W - No estoy seguro, aparentemente es algo relacionado con el pitch (acompañamiento de -2 a 0, por defecto está a 0) (y de W-1 y W-2)
      M - Hace sonar la voz cómo si fuese la versión1.32 de VS4U.
      Lo pueden descargar aquí:
      VS4U141.zip

      presamp:
      Es un nuevo resampler cuyo fin es servir de ayuda a los bancos de voz CV VC, pudiendo usarlos en UST CV como si fuese un UST CV VC (ya que el presamp pone las partes VC de forma automatica)

      Es muy fácil de usar, se debe poner cómo herramienta 1 y 2 el presamp, y seleccionar todas las notas que queramos usar con nuestro cv vc (normalmente, todas) e ir a Herramientas -> Plugins -> Predit (el plugin predit viene dentro del zip de descarga del presamp, solo muevan la carpeta de predit a la carpeta de plugins) y allí seleccionar el wavtool y resampler que queremos usar (por ejemplo fresamp y wavtool4vcv) y darle a aceptar. Ahora cuando rendericemos el UST CV sonará cómo si fuese CV VC.

      Si tenéis problemas o preferís ver un ejemplo visual de como usar presamp, les dejo el videotutorial de Teren000 que está en español: 【Herramienta UTAU】Presamp【Tutorial en Español】

      Si aún así lo queréis, aquí va el link: presamp0871.zip
      Y la versión instalable (se instala todo solo): presamp0871_setup.zip


      utaugrowl:
      Es un nuevo "resampler" (por llamarlo de alguna forma) cuyo fin es hacer que las voces suenen como si estuvieran gritando (como uno de los Sakebi o Kire)
      Para usarlo hay que emplear la flag w (0-100) donde se quiera hacer este efecto. Esta herramienta necesita a un resampler como base para poder funcionar.

      Para usarlo, debes poner el utaugrowl.exe dentro de la carpeta donde tengas todos tus resamplers, luego, el resampler con el cual quieras usar el growl debes hacerle una copia y llamarlo nombredelresampler_ug. Por ejemplo, yo quiero usar TIPS con el utaugrowl, así que hago una copia de TIPS y la llamo TIPS_ug.
      Luego, cuando tengas el documento abierto, carga el utaugrowl como si fuera un resampler normal (en el espacio de la segunda herramienta) y añade la flag w donde quieras que haga el growl. Así de sencillo.
      Por cierto, es compatible con el patcher de resampler de nmasao, solo asegúrate que el utaugrowl y el loquésea_ug estén ambos patcheados.

      Os dejo un vídeo de demostración: 【UTAU】グロウル効果追加エンジン【v2.10(15/01/31)配布】 ‐ ニコニコ動画:GINZA

      Y el link: utaugrowl100.zip

      Resamplers que no llegaron a ser sacados:


      M4:

      Mucho se ha hablado sobre este resampler. Según parece Ayame/Ameya estaba trabajando en él, pero dejó de lado el proyecto alegando que es demasiado inestable. Es y será una beta cerrada al público.
      Pero nunca se sabe, quizás algún día intenten crear una versión más estable de este resampler.
      Por lo poco que pude escuchar de este resampler, las voces suenan con él poco claras.


      También añado un sitio donde se pueden escuchar varias demostraciones con algunos resamplers (Incluido M4 y favoco6) -> JW FLV Media Player


      Si tienen alguna información o quieren compartir alguna experiencia usando algún resampler, os invito a hacerlo.
      Igual si algún link se cae, avísenme.


----------------------------------------------------------

Y esto es todo. Intenté ponerlo todo de forma clara y ordenada porque en total es mucho texto.

Para dudas, sugerencias o lo que sea, dejen un comentario.

Me gustaria agradecer a Sr.G por ser el creador del tema original de UTAU acá y a toda la gente que aportó en ese tema reclists y otras cosas interesantes, parte de la información de este tema fue sacada de ese tema, aunque otra parte también viene del foro internacional Utaforum, ¡así que muchas gracias a ellos también! c:


Si necesitan contactarme por lo que sea, mi canal de YouTube y mi deviantart están en mi firma, me paso por esos sitios todos los días.
 
Última edición por un moderador:

Sr. G

Alternative...?

Registrado
16 Jun 2008
Mensajes
2,072
Offline

SpanishPandaHero

Apologize to the funyarinpa!

Registrado
25 Mar 2012
Mensajes
150
Ubicación
Antártida
Offline
Buen tema, yo no tenía tiempo para organizar el que cree cuando los inicios de la comunidad, así que la moderación ya puede cerrarlo si así le apetece, aquí el link: Utau - [Tutorial]Utauloid como hacerlos CV y VCV - Info nueva agregada. - Vocaloid | Foros Dz
Aunque antes de cerrar mi tema, si S SpanishPandaHero quiere sacar algo de mi tema, que aproveche, sino, pues cierren mi tema c:
Suerte.
Por mí no hay problema por que lo cierren, ya saqué todo lo que necesitaba xD
 
  • 1Me gusta
Reacciones: Niki

La Phantom || 洋介の妻。
Diseñador Oficial

Registrado
4 Jun 2010
Mensajes
3,362
Ubicación
Prussia
Offline
Buen tema, yo no tenía tiempo para organizar el que cree cuando los inicios de la comunidad, así que la moderación ya puede cerrarlo si así le apetece, aquí el link: Utau - [Tutorial]Utauloid como hacerlos CV y VCV - Info nueva agregada. - Vocaloid | Foros Dz
Aunque antes de cerrar mi tema, si SpanishPandaHero quiere sacar algo de mi tema, que aproveche, sino, pues cierren mi tema c:
Suerte.
gracias por pasa el link del tema anterior! ya quedo cerrado! =) se agradece mucho la colaboración!

el tema quedo esplendido ♥
 

Trinox

Yo uso el (?) Como pregunta, no como sarcasmo

Registrado
23 Nov 2014
Mensajes
3,901
Offline
tengo una pequeña pregunta, soy nuevo en esto y no tengo ningun microfono decente ¿Donde podria encontrar fenomas en español o inlges? y ¿Cual modo seria el mejor para hacerlos?
 

Sr. G

Alternative...?

Registrado
16 Jun 2008
Mensajes
2,072
Offline
tengo una pequeña pregunta, soy nuevo en esto y no tengo ningun microfono decente ¿Donde podria encontrar fenomas en español o inlges? y ¿Cual modo seria el mejor para hacerlos?
si te refieres a busca los archivos wav (grabaciones) en internet, es una violación a la normativa de Utau, debes grabarlos tu mismo los fonemas.
Ahora si te refieres a la lista de fonemas, en el tema están aunque la de fonemas en inglés no sé si esté, tendrás que buscarlo.
 

Trinox

Yo uso el (?) Como pregunta, no como sarcasmo

Registrado
23 Nov 2014
Mensajes
3,901
Offline
si te refieres a busca los archivos wav (grabaciones) en internet, es una violación a la normativa de Utau, debes grabarlos tu mismo los fonemas.
Ahora si te refieres a la lista de fonemas, en el tema están aunque la de fonemas en inglés no sé si esté, tendrás que buscarlo
Gracias por la informacion, espero me salga bien todo
 
F

Florencia Daniela D

Invitado

Offline
Tengo Una duda....No me ah quedado muy claro el cómo usar el UtauGrowl, podrían explicarme? Gracias.
 

Foxer-Fox

El de baja anatomía

Registrado
18 Abr 2016
Mensajes
151
Offline
Yo me rompí la garganta para que luego me salga horrible. Lo que no entiendo es el editor, el azul es para el comienzo y final, pero la linea roja, verde y el rosa para que son?

Yo uso el micrófono interno de mi Netbook, mi UTAU puede cantar decentemente a pesar de eso?
 

Sr. G

Alternative...?

Registrado
16 Jun 2008
Mensajes
2,072
Offline
Yo me rompí la garganta para que luego me salga horrible. Lo que no entiendo es el editor, el azul es para el comienzo y final, pero la linea roja, verde y el rosa para que son?

Yo uso el micrófono interno de mi Netbook, mi UTAU puede cantar decentemente a pesar de eso?
el sombreado del final es la partedel wav que no sonará, recuerdo que una línea era indicativa de donde acaba la consonante, ahora no recuerdo cual color era xD
 
Arriba Pie