Para una secuencia ortonormal completa (esto es, para una secuencia ortonormal que a la vez es una base ortonormal de ), nosotros tenemos la identidad de Parseval, que reemplaza la desigualdad por una igualdad (y consecuentemente con ).
La desigualdad proviene en realidad de una identidad, válida para toda base ortonormal. Como todo conjunto ortonormal de vectores es linealmente independiente, entonces debe existir un número finito de vectores con los cuales puede completarse β hasta obtener un sistema generador de V. Sean
estos m – n vectores ortonormales faltantes, donde m ≥ n. El conjunto que resulta de agregar dichos vectores a β, es decir
el conjunto β dado puede ser en sí mismo una base ortonormal, en cuyo caso la desigualdad de Bessel pasa ser una identidad, pues m = n.
Si β no es una base, entonces el conjunto (2), con m > n, sí lo es. Intuitivamente puede pensarse que se «quitan» elementos de la sumatoria (3) para considerar únicamente en ella los elementos del subconjunto β de la base ortonormal (2). Como esta sumatoria es positiva y el cuadrado de la norma de x es igual a la sumatoria completa, es decir, con todos los elementos de 1 a m, quitar un elemento implica disminuir esta sumatoria. Por lo tanto, la norma del vector x debe superar esta nueva sumatoria, a la cual le faltan m – n términos con respecto a (3). De ahí que (1) sea válida.
Demostración de la desigualdad si m > n
Consiste en separar la sumatoria (3) y eliminar el término positivo que sobra.