Twitterで細々と書いておりましたが、記事にしてみます。

歌の採点と言えばテレビ番組でおなじみの精密採点が搭載されているDAMが有名です。

DAMに次ぐ2番手としてはJOYSOUNDの分析採点が続いています。

    
DAMの採点は厳しく、JOYSOUNDの採点は甘いというのが世間一般の認知です。(現状はともかく。)

しかしこの甘い厳しいとはどこから来ているのでしょうか?

機械の採点が高い=歌うまという風潮も出来上がりつつあります。それは本当に正しいのでしょうか?

【2020/10/01 文章と内容を全体的に修正しました。】


一般的に、「歌が上手い」と言われる方はどのような歌い方をしているのでしょうか。

個人的には声質が良いのが条件で、抑揚とフォール適度なしゃくりがあるが上手いと言われているように感じます。もちろんこれは私が思う採点の基準であり、採点の仕方は人によって細かかったり大ざっぱだったり。
 
たとえば初期のボーカロイドを思い浮かべてみましょう。ボーカロイドなので音程はパーフェクトです。しかし棒読みのように聞こえることが多く、いくら音程が合っていても、ビブラートやしゃくりができていても、不自然に聞こえてしまうものです。
仮に機械の採点で音程、ビブラート、しゃくりの3項目しか存在していない場合、どんなに不自然に聞こえていても100点が取れます。

これが機械と人間の分かりやすい差です。

音程に関してですが、普通に考えると必須条件です。実は「音程」とは2種類あります。
機械の採点の「音程」と人間の判定する「音程」は実は全く異なるものなのです。

例えば機械の判定で音程正解率90%だったとしましょう。
90%もあっているんだからさぞ曲に関してはばっちり。。。思いきや実はカラクリがあります。残りの10%の外し方です。

若干#になっていたりしていて、バーとのズレの距離ががあまりなければ人間にとってはほとんどズレと認識されません。テクニックによっては本物よりうまく聞こえることもあるでしょう。
反対に10%のバーを完全に外していればすごく音痴に聞こえます。サビで高音がへにゃへにゃになっていると評価が上がりにくくなってしまいます。

10%の音程の外し方で人間の評価は大きく変わります。しかし機械にとっての10%は同じと判定されます。

機械の評価は正解=100点、不正解0点といった絶対的な採点に対し、人間の評価は正解=100、不正解=99~0といったように音程に対する部分点を与えます。
当然人間の評価も音程を大きく外していれば0になりますが、違いに気づかないほどの外れ具合ならば大きな部分点を得ることができます。音程の評価は機械よりも人間の方が甘いのです。

さらに、マイナーな曲(特に歌手や曲名、サビは有名だけどその他はあまり知られていないような曲)を歌えばさらに音程は誤魔化せます。なぜならば、「この曲を知らない→でも歌い方はかっこいい、かわいい→すごい」となるからです。

知らない人が知らない曲を歌っていた場合がこれに当てはまります。
聞いている人にとっては音程という判定基準が存在していない(もしくはかなり曖昧)であるがために、音程以外の部分での評価を実行しようと試みます。音程が無くなった以上、この「人間採点」の評価は一気に主観的なものになります。
音程が多少外れていたとしても正解がインプットされていないがために採点の基準が変わってくるのです。
「どう聞いても音痴!」という事もありますが、人間の採点は部分点が取れれば問題ないのです。80%くらいでいいのです。

他にも主観的なものとして「ルックス」があげられます。例えば歌い手と呼ばれる方々たちは主に2次元のイラストをプロフィール画像として使用し、「イメージ」をつけることによって活動を行っています。
もちろん顔バレ等のリスクを避ける面もあるでしょうが、普通に自分の写真を載せるよりかは曲に合ったイラストの方がよりよい印象を与えます。このイメージによって上手さの補助を与えているわけです。

次に「性別や年齢」。  
小さい子供に対してはおのずと評価が高くなるかもしれませんし、男性よりかは女性の方が評価が高くなりがちです。声質のせいもあるかもしれませんが。。。
アイドルグループが成立しているのもこのあたりが大きいです。女性アイドルグループは男性の、男性アイドルグループは女性のファンが多いです。いわば好感度によって歌を広げようとしています。    
   
知り合いに対しての評価も若干高くなるのではないでしょうか。知らない人よりかは知っている人が歌っている場合、うまく感じる(評価を上げる)傾向にあるようです。

もう1つの基準として「評価のしやすさ」。いわばアピールポイントがあるかどうか。
高い声、低い声、セクシーな声、渋い声、元気な声。。。何かしら人に説得力を持たせることが評価されることもあります。
器用貧乏な場合、あえてウイークポイントをつくるのもありです。とにかく、印象をつけることは大切なのです。

どうしても努力で埋められない項目があるとき。
例えば、男の人の場合はかわいい声はほとんどの人は出せませんが、かっこいい声を出せる人は多いはずです。そのため、女性曲をかっこよく歌うこともアピールポイントのひとつにできます。 正反対でも評価はつくることができます。       

人間が歌っていると何故か順位はつけられるものです。 その時は尖っている項目がある方が有利に働きます。 
全部80点よりも様々な項目で100点や50点が混ざった結果平均70点くらいの方が評価は高くつきやすいです。それは、「理由を話しやすいから」です。上手いはずなのに評価されないのは器用貧乏だからというのもあります。「うまいだけ」の人なら極端な話かなりの人数います。この「評価されるもの」をつくりあげるのも一つのポイントだと感じています。 
機械が判定する場合、ルックスや性別、年齢を判定してくることはありません。将来はできるかもしれませんが。
 
人間は

「声質+抑揚+しゃくり+フォール+ルックス+性別年齢+好感度+評価のしやすさ+その他いろいろ」

かなり複雑な要素が組み合わさって初めて高得点と言われるのです。
そう考えると、「人間採点」も機械と同様に採点狙いの歌い方をしないといけません。しかし、採点の基準は機械とは違います。人間の採点の配点は人によってそれぞれの基準を持っています。
全部を埋めるというのは困難です。

機械の採点はどうでしょうか。
DAMの採点は
「音程+安定性+抑揚+ロングトーン+ビブラート+テク3種+リズム+裏加点」

JOYの採点は
「音程+安定感+ロングトーン+抑揚+テクニック(ビブ+テク2種)」

このようになっています。

そのため、この決められた項目を「埋める」ことができる人が高得点となります。   

一般的にはJOYSOUNDの方がDAMより簡単だと言われます。それは、JOYSOUNDの方が意図せずとも勝手に埋まる項目が多く、対してDAMは抑揚や安定感といった意識しないと(知らないと)点数の出ない項目が多いからです。
普通の曲で90点前後を狙うのであらばJOYSOUNDの方が簡単ですが、100点を狙うのであればDAMの方が簡単という人が多いようです。
大多数の人は特に項目に意識することなく歌うため、表示された点数を見てDAMは難しい、JOYは簡単といったイメージができ上がっているのです。



誰しも好きなアーテイストはいると思います。この好きなアーティストこそ、自分の「人間採点」で100点、もしくは高得点を獲得しているアーティストではないのでしょうか。
プロの歌手が機械の採点でも高得点を出せると限らないのはここにあるのです。
プロの方はもちろん能力は高いですが、「機械の採点にない分野で点数を稼いでいる」からです。というよりも、稼げるからこそプロになれているのです。機械の採点にない分野での評価を稼げない人はどんなに機械で高得点を取れても上手いとは言われないのです。(特に私みたいに) 

そう考えると、人間の採点って本当に難しいものですね。        

埋めるべき項目さえ分かれば「機械採点」と「人間採点」の両立は行えます。その辺りも腕の見せ所でしょう。しかし、機械の採点をする(人前で歌わない)のであれば歌い方は型にはまった1つになります。    
 
機械と人間との採点の違いは野球で言うバッターとピッチャーみたいなものです。
「エースで4番」を狙う人もいれば、「9番ピッチャー」「4番DH」を狙ってもいいのです。        

個人的に歌い方に決まった形はないと思っております。楽しく歌う事、もしくは目的を達成するためにこつこつ練習すること、ただ点数だけを追い求めること。人前で披露すること。様々な歌い方があってのこそのカラオケだと感じております。

賛否両論あると思いますが以上です。
長文でしたが読んでいただきありがとうございました。