Propuesta: mejora para el sistema que detecta los enlaces duplicados cuando le damos a "Enviar"

Visto en: Ejemplo 1 - Ejemplo 2

Crear un toleracia de coincidencia para las URL enviadas de un +/- 3'6%

Por experiencia de casos prácticos, entiendo que actualmente no hay tolerancia, es decir, solo actúa cuando detecta una coincidencia del 100% entre dos URL.

Si se "perfila" el código puede incluirse una comprobación de caracteres para que si detecta un +/- 3,6% (u otro valor que veais más aceptable, según estudio, baremos) de caracteres "no coincidentes, siempre y cuando sean consecutivos los detectados y que además, estén situados en la última sección de la URL analizada (últimos 18 caracteres, por ejemplo).

Enlace 1: https:// www.nohagospam.com /motor/actualidad/20210213/6240277/primeros-coches-electricos-automocion-siglo-xix-xx-desaparicion.html [Versión PC] 100% (131 caracteres)
Enlace 2: https:// www.nohagospam.com /motor/actualidad/20210213/6240277/primeros-coches-electricos-automocion-siglo-xix-xx-desaparicion.amp.html [Versión Móvil] 100% + 3.05% (135 caracteres)

Como vemos, la diferencia .amp no fué detectada, a persar de simplemente diferir en 4 caracteres (+3.05%).

La misma lógica de comprobación la podríamos aplicar para el dominio/subdominio de la URL (pasado el https:// hasta el primer /), siempre y cuando el resto de la url, sea coincidente 100%.

Como detalle adicional, se podría configurar un aviso para que el usuario compruebe si realmente es duplicada, para hacerlo algo diferente respecto al aviso actual de cuando es una coincidencia del 100%.

Espero sea de ayuda y sirva para mejorar la comunidad.

¡Salud!

PD: Si ya se ha sugerido anteriormente y/o está en marcha un sistema similar, ¡a darle caña!