La définition même de « mot » fait difficulté, ce qui vide de sens la question de la « richesse » relative du vocabulaire des diverses langues : les langues dites « agglutinantes », par exemple, peuvent créer une infinité de « mots » dont chacun équivaudrait pour nous à une phrase entière. Est-ce que j’utilise plus de « mots » si je dis melting pot ou rayon de soleil que si je dis creuset ou sunray ?
Si l’on parle de la langue française (ou anglaise), de quoi s’agit-il ? Prend-on en considération tous les domaines, toutes les époques, tous les niveaux de langue ? Il est impossible de fournir un dénombrement de l’ensemble des formes qu’offre une langue : certaines (comme dans le cas de tous les verbes que l’on peut composer avec le préfixe re-) n’ont qu’une existence virtuelle ; chaque jour, d’autres se créent ou disparaissent de l’usage. Le vocabulaire spécialisé des sciences est en constant développement : le Dictionnaire de la chimie de Duval, loin d’être exhaustif puisqu’on distingue plus de 100 000 matières colorantes, comptait déjà 26 400 entrées en 1935, mais plus de 70 000 en 1977 !
Tout ce que l’on peut dénombrer, ce sont les «entrées» constituant les nomenclatures des divers dictionnaires, les formes qu’ils enregistrent, choisies par les éditeurs selon l’idée qu’ils se font des besoins de l’utilisateur et selon des principes qui leur sont propres : une entrée générale pour une même forme ou une par sens, syntagmes composés en plus des formes simples, etc.
Fondés sur des enquêtes de fréquence, le « français fondamental » et le « français élémentaire » comptent respectivement un peu plus de 1 000 à 3 000 entrées. Les dictionnaires scolaires destinés aux élèves de 8 à 14 ans en comptent de 2 000 à 20 000, le Trésor de la langue française environ 100 000 (non compris les dérivés intégrés aux articles), les grands dictionnaires encyclopédiques environ 200 000 (y compris les noms propres).
Quant aux dictionnaires de la langue courante, qui recensent grosso modo le vocabulaire nécessaire à la conversation, à la lecture de la presse générale d’information et à celle des textes littéraires du XVIe siècle à nos jours, en y ajoutant un pourcentage variable des termes spéciaux, de formes rares, archaïques, régionales ou dialectales, ainsi que d’emprunts aux divers pays francophones ou aux langues étrangères, ils comportent environ 60 000 entrées, en français comme en anglais ou en chinois.