De l’accélération des requêtes à la réplication de comptes, voici dix fonctionnalités actuellement en bêta publique sur Snowflake.
Tables dynamiques, observabilité native, détection automatique des schémas de requis… Autant de fonctionnalités sur demandées Snowflake est revenu cette semaine à l’occasion du Snowday 2022. Toutes en sont au stade de la bêta privée. D’autres, au contraire, sont en accès public. En voici dix, toutes ouvertes cette année.
Entrepôts et grands
Option acquise en juin. Accessible à tous. Deux configurations : 5X-Large et 6X-Large. En disponibilité générale sur toutes les régions AWS et en avant-première sur les régions Azure. L’utilisation des crédits Snowflake double lorsqu’on passe à la taille d’entrepôt supérieure.
Service d’accélération des requêtes
Option acquise en mai. Accessible à partir de l’édition Enterprise. Elle fournit, pour les « grosses » requêtes, une capacité de débordement sur les ressources de calcul partagées. Les commandes SQL prises en charge : SELECT, INSERT (avec instruction SELECT) et CREATE TABLE AS SELECT.
Entrepôts optimisés pour Snowpark
Option ouverte ce mois-ci. Accessible à tous. Avec elle, chaque nœud fournit 16 fois la quantité de mémoire et 10 fois la quantité de cache d’un entrepôt standard. Disponible pour le moment sur 9 régions AWS, 5 Azure et une Google Cloud (aux USA). Son lancement va de pair avec la disponibilité générale de Snowpark pour Python (en plus de Java et Scala).
Type de données GEOMETRY
Ce type de données géospatiales, ouvert en août et accessible à tous, GEOGRAPHIE complète. Ce dernier suit la norme WGS 84 et modélise la Terre comme si elle était une sphère parfaite. La GEOMETRIE représente quant à lui les caractéristiques dans un système de coordonnées planes (euclidien, cartésien).
Réplication et basculement/restauration de compte
Option ouverte en août. Réplication des bases de données et des partages accessibles pour tous les comptes. Édition Business Critical ou supérieure requise pour la réplication d’autres objets et pour le basculement/la restauration automatiques. Toutes les régions AWS, Azure et Google Cloud la consommation en charge.
Connexion entre Snowpipe et Pub/Sub ou Azure Event Grid
Option ouverte en juin. Accessible à tous. Avec elle, Snowpipe (service d’alimentation de données en continu) peut envoyer des notifications d’erreur à ces deux services de messagerie cloud.
Pas de prise en charge inter-cloud pour le moment : Snowflake ne peut pousser des messages que vers le service fourni avec la plate-forme où il est hébergé (Google Cloud pour Pub/Sub, Azure pour Event Grid).
Traitement de données non intégrées avec des UDF/UDTF Java
Ouvert depuis avril. Accessible à tous. Permet de lire et de traiter des données non intégrées en zone de préparation. En utilisant soit des UDF (fonctions définies par l’utilisateur), soit des UDTF (fonctions de table définies par l’utilisateur).
Historique d’accès pour les colonnes
Option ouverte en octobre. Accessible à tous. Elle permet de visualiser, lors des opérations d’écriture, les flux de données entre les colonnes sources et de destination.
Procédures anonymes
Option ouverte en octobre. Accessible à tous. Elle utilise la commande SQL CALL pour créer et appeler ce type de procédures, similaires aux procédures similaires mais non conservées pour un usage ultérieur. L’exécution se fait avec les droits de l’appelant, le contexte de session et un accès aux variables et paramètres de session de l’appelant.
Diverses capacités pour le service d’optimisation de la recherche
Le service est accessible à partir de l’édition Enterprise. Parmi les derniers ajouts :
– Possibilité de définir les colonnes concernées dans un tableau
– Prise en charge des recherches impliquant sous-chaînes et expressions régulières (prédicats de type LIKE, CONTAINS, ENDSWITH…)
– Support des colonnes VARIANT, OBJECT et ARRAY (données semi-structurées), ainsi que des requêtes utilisant des fonctions géospatiales avec des objets GEOGRAPHY
Illustration principale © Snowflake