Cloud Search Hybrid Preview - Introductie
SharePoint Hybrid Search
Enkele jaren geleden heeft Microsoft de eerste mogelijkheden gepresenteerd omtrent het opzetten van een hybride connectie, tussen SharePoint Online (Office 365), en SharePoint On-Premises. On-Premises betekent in deze zin, een SharePoint Farm op servers in eigen beheer in een datacenter, of op basis van Azure IaaS.
Specifiek op het gebied van zoeken binnen SharePoint op documenten en andere content, heeft het opzetten van deze connectie als resultaat, dat wanneer een zoekopdracht werd uitgevoerd vanaf een Online Zoekcentrum in SharePoint, in een apart "blok" ook maximaal tien zoekresultaten werden getoond vanuit een On-Premises SharePoint omgeving. Op de achtergrond, wordt er in feite dezelfde zoekopdracht naar de andere kant verstuurd, verwerkt, en teruggestuurd. Dit resultaat wordt vervolgens onafhankelijk getoond naast de lokale zoekresultaten.
Ook andersom, kunnen er Online zoekresultaten, in een On-Premises zoekcentrum worden getoond (waarbij beveiliging op een resultaat wel wordt meegenomen, en dus eventueel ook wordt verborgen voor de ongemachtigde gebruiker).
Hoewel dit erg mooie technologie is, zitten er wel een aantal nadelen aan deze huidige opzet:
- de SharePoint Online Search index, en de SharePoint On-Premises Index, zijn nog steeds twee volledig gescheiden zaken. Er was geen manier om deze daadwerkelijk te combineren, en dus moesten beide bronnen nog gescheiden worden weergegeven, in technische en logische zin.
- Om zoekresultaten uit On-Premises, weer te geven in SharePoint Online, moest er een inbound connectie worden gemaakt naar de On-Premises SharePoint Farm, mocht je ook gebruik willen maken van On-Premises resultaten in Online.
- Het instellen van de benodigde Trust voor deze opzet, was een behoorlijk ingewikkelde procedure (een aantal pagina's aan regels Powershell), en ook was dit daarna zeker niet stabiel te noemen. Inmiddels is er redelijk goede documentatie via Technet te vinden.
Hieronder een afbeelding van deze opzet:
Nieuw: Cloud Hybrid Search Preview
Na enkele kleine voorbodes, werd tijdens de Ignite 2015 (begin mei), Cloud Hybrid Search aangekondigd. Dit moet de vervanger gaan worden van de huidige Hybrid mogelijkheden, en zou met name ook bovengenoemde punten moeten oplossen.
Kort gezegd, komt het erop neer, dat de gecrawlde On-Premises content, niet langer in een On-Premises Search Index wordt opgeslagen, maar in de SharePoint Online Index. SharePoint Online Content wordt uiteraard nog steeds in de Online Index opgeslagen. Concreet geeft dit de volgende voordelen:
- Beide locaties, delen dus een enkele Search Index, met als gevolg intelligentie (Ranking, Sorting en Filtering) tussen die resultaten.
- De specifieke soorten en locaties van content, worden nog steeds via de On-Premises Service Application beheerd. Dat geeft onder andere controle over Crawl Contentsources, Scheduling en Rules.
- De Search Index hoeft niet meer On-Premises opgeslagen te worden, dit kan aanzienlijk schelen in de daarvoor benodigde investering in servers en licenties.
- Er is geen Inbound connectie (Cloud naar On-Premises) meer noodzakelijk, de Online Index wordt namelijk Outbound (On-Premises naar de Cloud) gevoed.
- Het indexeren van SharePoint 2007, 2010 en 2013 content is ondersteund, vanuit de Cloud Search Service Application.
Een goede (behoorlijk technische) Ignite sessie is hier te bekijken: https://channel9.msdn.com/Events/Ignite/2015/BRK3134
Om dit visueel te maken, een afbeelding van Cloud Hybrid Search uit de Preview documentatie:
Data in de Cloud
De definitie van een Hybride SharePoint omgeving, is een deel van de SharePoint Content binnen een On-Premises Farm, en een ander deel in SharePoint Online. De verdeling daartussen zal voor elke organisatie anders zijn. Daarbij er meerdere redenen zijn om bepaalde content binnen de eigen muren te houden, denk bijvoorbeeld aan:
- Content met een bepaalde dataclassificatie, welke bepaald dat de organisatie hierover ten alle tijde de volledige en enige controle moet hebben.
- Full trust / Legacy maatwerk kan het onmogelijk of zeer kostbaar maken, om dit te migreren naar de Cloud.
- Een specifieke vorm van authenticatie, niet geschikt voor gebruik in Office 365 (alhoewel ook hier inmiddels meer mogelijkheden in zijn, in de vorm van SAML 2.0 Claims authenticatie).
- Grote gemaakte investeringen in huidige hard- en software, welke zich (voorlopig) nog niet hebben terug betaald.
Het spreekt voor zich, maar een direct gevolg van het opzetten van een hybride connectie, is een bepaalde mate van uitwisseling van content tussen On-Premises en Online. het concrete gevolg van Cloud Hybrid Search, is dat de geïndexeerde content, en eigenlijk dus de daadwerkelijke inhoud van pagina's en documenten, in de Microsoft Cloud komt te staan. Dit is iets wat geaccepteerd zal moeten worden, mocht een organisatie de keuze willen maken om met Hybride technologie aan de gang te gaan.
Concluderend
Het introduceren van Cloud Hybrid Search, geeft duidelijk aan dat Microsoft begrepen heeft dat niet elke organisatie klaar is voor een volledige overgang naar de Cloud, in de vorm van Office 365. Daarvoor kunnen diverse redenen gelden, op het gebied van dataclassificatie en beveiliging, maatwerk, et cetera. Toch biedt de Cloud enorm veel voordelen, met name op het gebied van scholing, wereldwijde beschikbaarheid en kosten. De ideale weg zou daarom best wel eens in het midden kunnen liggen, en deze nieuwe technologie kan helpen om de scheidslijn tussen Cloud en On-Premises te vervagen.
Zoals overal duidelijk vermeld, is dit nog wel echt Preview technologie, wat betekent dat het officieel nog niet in productie scenario's gebruikt kan worden. Organisaties kunnen nu al wel testen en bekijken hoe de techniek werkt en wat er (waarschijnlijk) nodig gaat zijn voor een productie implementatie, wellicht in samenwerking met Wortell als ondersteunende partner.
In de volgende 'How-to' blogpost, geef ik meer informatie over de benodigde infrastructuur, voorbereidingen en technische stappen om Cloud Hybrid Search werkend te krijgen.