MongoDB encuentra duplicados

“¿Alguna vez has oído hablar del concepto de duplicación de datos cuando se trabaja en bases de datos? Cuando un registro, cosa, persona o lugar tiene una copia exacta, se dice que esa copia es un duplicado del original. Mientras trabajamos en bases de datos tradicionales, usamos la cláusula WHERE para encontrar los duplicados en los registros de la tabla, es decir, SQL, PostgreSQL. Por otro lado, MongoDB no te permite usar la cláusula WHERE para averiguar los duplicados insertados en las colecciones de una base de datos específica. Desarrolló la función agregada para averiguar los valores duplicados de la colección. Hoy, en este artículo, vamos a discutir cómo insertar registros duplicados en las colecciones de Mongo DB y mostrarlos en el shell de MongoDB usando el comando collections Aggregate. Comencemos nuestro artículo de hoy sobre cómo usar la actualización apt y las instrucciones de actualización dentro del shell del terminal del sistema Ubuntu 20.04. Para hacer esto, primero debe iniciar sesión y abrir el shell con «Ctrl+Alt+T». Después de eso, puede probar las instrucciones que se muestran a continuación en su shell y agregar la contraseña para que el usuario continúe con el proceso de actualización.

Es posible que se requiera su confirmación para continuar con este proceso. Toque «y» cuando se le pregunte «¿Le gustaría continuar?» Después de eso, presione Entrar.

El procesamiento puede tomar más o menos tiempo dependiendo de la situación de su sistema.

Después de la actualización completa, obtendrá las líneas de procesamiento finales que se muestran a continuación.

Después de la actualización y actualización exitosas del sistema, debemos abrir el shell de MongoDB para agregar algunas colecciones y registros a la base de datos. Para hacer esto, usamos la consulta «mongo» como se muestra en la imagen. El cuenco se ha preparado con éxito.

Cuando usamos la declaración «db» en el shell MongoDB, encontramos que la base de datos «test» estaba disponible para nuestro uso.

Por lo tanto, usamos la base de datos de «prueba» para más consultas y creamos una colección en ella. Para hacer esto, intente con la instrucción «use» seguida del nombre de una base de datos, p. por ejemplo, «prueba».

Para agregar registros, necesitamos una colección en la base de datos de prueba. Por lo tanto, necesitamos crear una nueva colección. Para hacer esto, debemos probar la instrucción «db» junto con la función createCollection() de MongoDB, seguida del nombre de una nueva colección entre paréntesis, es decir, Data. La consulta se realizó correctamente y la colección se creó correctamente según el estado «ok: 1». Además, en MongoDB, tendemos a usar la función find() con el prefijo del nombre de la colección para mostrar los registros de una colección específica. Por lo tanto, probamos la instrucción «db» seguida del nombre de la colección, es decir, Datos, y la función find() en ella. La recopilación de datos está actualmente vacía. Entonces necesitamos agregar algunos registros a la colección.

Para insertar los registros en la recopilación de datos de MongoDB, debemos probar la función insert () dentro de la declaración «db» junto con los datos en forma de documentos, es decir, formato de lista. Utilizamos un total de 4 columnas para datos de documentos de colecciones, es decir, _id, título, edad y precio. Agregamos un total de 5 registros para todas estas 4 columnas de recopilación de datos.

El registro se agregó correctamente, ya que el resultado anterior muestra que la cantidad de registros es 5 para la opción «nInserted». Después de eso, usamos la función find() con la colección «Data» para buscar y mostrar todos los registros de esta colección. No pasamos ningún argumento al paréntesis de una función find() para no limitar los registros de la colección. Los 5 conjuntos de datos para la recopilación de datos se presentaron en Mongo DB shell.

Ya que hemos cubierto el tema de encontrar duplicados en las colecciones de MongoDB, también necesitamos tener algunos registros duplicados en las colecciones. Por lo tanto, agregamos tres conjuntos de datos más a la recopilación de datos para usarlos como duplicados de algunos de los conjuntos de datos ya insertados. Solo necesitamos actualizar la columna _id porque la ID de cada columna debe ser única en MongoDB como solíamos hacer en las bases de datos tradicionales. La misma función de pegado se utilizó anteriormente con el nombre de colección «Data». Se han añadido los tres registros.

Ahora, si ejecuta la declaración «db» con el nombre de colección «Data» seguido de la función find() nuevamente en el shell de MongoDB, verá el total de 8 registros en su pantalla. Podemos ver los valores duplicados para columnas que no sean _id en esta colección de datos.

Es hora de probar el método de agregado () en la recopilación de datos para enumerar los valores de columna específicos que se duplicarán en él. Debe usar la sintaxis que se muestra a continuación de un comando agregado en MongoDB. La opción $group se usa para agregar todos los valores duplicados de una columna determinada en una columna, mientras que la opción $match se usa para encontrar los grupos con más de un documento. Por otro lado, la opción $proyecto se usa para especificar el formato para mostrar los registros duplicados. El primer campo de la opción $group especifica el nombre de la columna en la que buscar duplicados. Se encontraron un total de 3 registros duplicados para la columna «Título» de una recopilación de datos. Después de eso, se probó la misma consulta para la columna «Edad» y arrojó 3 resultados nuevamente.

Conclusión

La explicación de los registros duplicados se ha dado en el párrafo introductorio y hemos discutido la diferencia entre encontrar duplicados de bases de datos tradicionales y MongoDB. Para este propósito, tratamos de demostrar cómo crear una nueva colección en MongoDB e insertar registros en ella. Además, analizamos el uso de la función de agregado para averiguar la columna específica que contiene el valor duplicado en las colecciones. Este artículo ha revelado la clara diferencia en la búsqueda de duplicados para MongoDB en comparación con cualquier otra base de datos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.